PDF/A: El estándar ISO para el archivo de documentos a largo plazo
PDF/A es una familia de estándares ISO que define un subconjunto de PDF específicamente diseñado para el archivado a largo plazo. Mientras que el PDF normal permite dependencias externas (fuentes enlazadas, medios externos, JavaScript, cifrado), PDF/A impone la autocontención: todo lo necesario para renderizar el documento de forma idéntica debe estar incrustado dentro del propio fichero.
¿Por qué PDF/A? El problema con el PDF normal
Un fichero PDF estándar puede referenciar:
- Fuentes externas: depende de que esa fuente esté instalada en el sistema de visualización
- Cifrado: un PDF cifrado no puede leerse por un visor futuro sin la clave
- JavaScript: el comportamiento puede cambiar con las versiones del visor
- Medios enlazados: ficheros de imágenes, audio o vídeo externos que pueden no existir en el futuro
PDF/A prohíbe todo esto, asegurando que el documento se renderizará de forma idéntica en cualquier visor conforme en el año 2100.
Niveles de conformidad y partes de PDF/A
| Estándar | Base | Novedades principales |
|---|---|---|
| PDF/A-1 (ISO 19005-1:2005) | PDF 1.4 | Conformidad A (accesible) y B (visual) |
| PDF/A-2 (ISO 19005-2:2011) | PDF 1.7 | JPEG 2000, transparencia, capas opcionales |
| PDF/A-3 (ISO 19005-3:2012) | PDF 1.7 | Permite adjuntar cualquier tipo de fichero |
| PDF/A-4 (ISO 19005-4:2020) | PDF 2.0 | Nuevos niveles E (ingeniería) y F (adjuntos) |
Los niveles de conformidad (A, B, U) indican:
- A: Accesibilidad completa — etiquetas de estructura, mapeo de caracteres Unicode, orden de lectura lógico
- B: Solo preservación de apariencia visual
- U: Preservación visual + mapeo de caracteres Unicode
Lo que PDF/A prohíbe
| Característica prohibida | Motivo |
|---|---|
| Fuentes no incrustadas | La no disponibilidad de fuentes hace el texto irrepresentable |
| Cifrado | Impide el acceso futuro |
| JavaScript | El comportamiento puede cambiar con las versiones del visor |
| Contenido de audio/vídeo | Los medios externos pueden no estar disponibles |
| Referencias a contenido externo | Los enlaces a ficheros externos pueden romperse |
| Espacios de color sin perfiles ICC | El renderizado de color dependería del dispositivo |
Lo que PDF/A requiere
| Característica requerida | Propósito |
|---|---|
| Todas las fuentes incrustadas | Renderizado de texto idéntico |
| Espacios de color con perfiles ICC | Reproducción de color coherente |
| Metadatos XMP | Propiedades de documento estructuradas y legibles por máquina |
| Estructura PDF válida | Tablas de referencias cruzadas y flujos de objetos correctos |
Los metadatos XMP son particularmente importantes: PDF/A requiere propiedades pdfaid:conformance y pdfaid:part en el XMP para autoidentificación.
Creación de ficheros PDF/A
Desde Microsoft Office
Word/Excel/PowerPoint:
Archivo → Guardar como → PDF
Opciones → Compatible con ISO 19005-1 (PDF/A) ✓
LibreOffice
# Exportar como PDF/A-1b
libreoffice --headless --convert-to \
"pdf:writer_pdf_Export:{SelectPdfVersion:{type:long,value:1}}" \
documento.docx
Ghostscript (convertir cualquier PDF a PDF/A)
# Convertir a PDF/A-2b
gs -dPDFA=2 -dBATCH -dNOPAUSE \
-sProcessColorModel=DeviceRGB \
-sDEVICE=pdfwrite \
-dPDFACompatibilityPolicy=1 \
-sOutputFile=salida_pdfa2b.pdf \
/usr/share/ghostscript/PDFA_def.ps \
entrada.pdf
Validación de la conformidad PDF/A
Crear un fichero como PDF/A no es lo mismo que tener un fichero PDF/A válido. Siempre valida:
VeraPDF (validador de referencia de código abierto)
# Validar conformidad PDF/A
verapdf --flavour 2b documento.pdf
# Validar y generar informe detallado
verapdf --format text --verbosity 6 documento.pdf > informe.txt
# Validar por lotes un directorio
verapdf --flavour 1b *.pdf
Fallos de validación comunes:
- Fuentes no incrustadas (más común)
- Perfil ICC de color o OutputIntent faltante
- Metadatos XMP faltantes
- Estructura XMP no válida
- Uso de características prohibidas (JavaScript, cifrado)
Casos de uso de PDF/A y requisitos de la industria
| Industria | Estándar | Nivel | Notas |
|---|---|---|---|
| Gobierno / legal | PDF/A-1 o 2 | A o B | Muchas jurisdicciones requieren PDF/A para presentaciones oficiales |
| Sanidad | PDF/A-2 | B | Archivo de registros médicos |
| Facturación electrónica (UE) | PDF/A-3 | B | ZUGFeRD, Factur-X incrustan datos XML de factura |
| Oficinas de patentes | PDF/A-1 | B | USPTO, EPO aceptan PDF/A-1b |
| Banca/finanzas | PDF/A-1 o 2 | B | Retención de documentos regulatorios |
| Museos/bibliotecas | PDF/A-2 | A | Máxima accesibilidad para patrimonio cultural |
PDF/A vs. PDF normal vs. PDF/X vs. PDF/UA
| Estándar | Propósito | Requisito clave |
|---|---|---|
| PDF/A | Archivo a largo plazo | Autocontenido, sin dependencias externas |
| PDF/X | Producción de impresión | Color CMYK, sin RGB, sin transparencia en v1 |
| PDF/UA | Accesibilidad universal | Etiquetado completo, texto alternativo, orden de lectura |
| PDF/E | Ingeniería | Soporte de contenido 3D |
| PDF normal | Uso general | Sin restricciones |
Resumen
PDF/A responde a una pregunta específica: "¿Se renderizará este documento de forma idéntica dentro de 50 años?" Al exigir la incrustación de fuentes, perfiles ICC de color, metadatos XMP y prohibir el cifrado y las dependencias externas, PDF/A crea artefactos de archivo autocontenidos. Para organizaciones con requisitos de retención de documentos a largo plazo — gobierno, legal, sanidad, finanzas, patrimonio cultural — PDF/A no es opcional sino un requisito de cumplimiento. Siempre valida los ficheros PDF/A con VeraPDF después de crearlos.