Saltar al contenido principal
Convertidor de imágenes Convertidor de vídeo Convertidor de audio Convertidor de documentos
Herramientas Guías Formatos Precios API
Iniciar sesión
🇬🇧 English 🇧🇷 Português 🇩🇪 Deutsch
Guía

PDF/A: El Estándar ISO para el Archivado a Largo Plazo de PDF

PC Por Pablo Cirre

Preguntas frecuentes

Todos son estándares de archivado ISO basados en especificaciones PDF cada vez más modernas. PDF/A-1 (basado en PDF 1.4, 2005) es el más restrictivo — sin transparencia, sin JPEG2000, sin adjuntos. PDF/A-2 (PDF 1.7, 2011) permite transparencia, JPEG2000, capas e incrustar otros archivos PDF/A. PDF/A-3 (PDF 1.7, 2012) es idéntico a PDF/A-2 pero permite incrustar cualquier tipo de archivo, lo que lo hace ideal para la facturación electrónica con XML incrustado (ZUGFeRD, Factur-X). PDF/A-4 (PDF 2.0, 2020) es la versión más nueva con firmas mejoradas y variantes especializadas.

Envía <strong>PDF</strong> cuando el documento es final y el layout debe preservarse tal cual (contratos, facturas, certificados). Envía <strong>DOCX</strong> cuando los revisores deben editar, comentar o usar control de cambios. Muchos equipos envían ambos: PDF como versión canónica + DOCX para feedback editable. PDF/A es el adecuado para archivado legal (ISO 19005).

El requisito central de PDF/A es que los documentos sean renderizables de forma independiente en el futuro lejano sin ninguna dependencia externa. El cifrado crea una dependencia en conocer la contraseña — un archivero, tribunal o aplicación futura puede no tener acceso a la contraseña 30 años después. ISO 19005 prohíbe explícitamente todo cifrado PDF. Si necesitas convertir un PDF cifrado a PDF/A, primero descífralo con `qpdf --decrypt --password=tucontraseña entrada.pdf salida.pdf`, luego conviértelo a PDF/A.

Round-trip entre formatos similares (DOCX ↔ ODT, DOCX → PDF) suele ser seguro. Round-trip con funciones específicas del formato (macros de Word, tablas complejas, notas al pie) suele perder fidelidad. Las fuentes incrustadas sobreviven solo si origen y destino lo soportan (PDF sí, DOCX sí, HTML plano no). Previsualiza siempre antes de borrar el original.

Usa VeraPDF — la implementación de referencia ISO gratuita y de código abierto: `verapdf --flavour 2b documento.pdf`. Especificar el sabor (1a, 1b, 2a, 2b, 2u, 3a, 3b, 3u, 4, 4e, 4f) es importante. VeraPDF informa de cada cláusula específica de ISO 19005 violada. Muchas herramientas que afirman crear PDF/A producen archivos no conformes — valida siempre con VeraPDF antes de aceptar un PDF como correctamente archivado.

Si el PDF contiene texto real (no imágenes escaneadas), <code>pdftotext</code> de poppler-utils o <a href="/es/convert/pdf-a-txt">PDF a TXT</a> funcionan en segundos. Si el PDF es escaneado, necesitas OCR — Tesseract es el estándar open-source. Las herramientas PDF de KaijuConverter detectan automáticamente texto vs. imagen y enrutan según el caso.

PDF/A-3 permite incrustar tipos de archivos arbitrarios dentro de un contenedor PDF/A. Los estándares de facturación electrónica como ZUGFeRD (Alemania), Factur-X (híbrido franco-alemán) y XRechnung usan esto: el PDF es la factura legible por humanos (impresa o enviada por correo al destinatario), y un archivo XML incrustado contiene los datos estructurados de la factura legibles por máquina para el procesamiento automático por sistemas ERP. Este enfoque híbrido satisface tanto los requisitos de legibilidad humana como los de procesamiento automatizado.

Edición ligera (anotaciones, firmas, campos de formulario) es viable en cualquier lector PDF. Edición estructural (cambiar párrafos, reemplazar imágenes) es incómoda — PDF es un formato de presentación, no de edición. El flujo robusto es: mantén el origen DOCX/MD/HTML como máster y regenera el PDF cuando haya cambios. Las herramientas que "editan PDF" hacen ingeniería inversa del layout y suelen romperlo.