¿Qué es DjVu y de dónde viene?
DjVu (pronunciado "déjà vu") es un formato de documento digital inventado en los laboratorios Bell de AT&T en 1996 por los investigadores Léon Bottou y Yann LeCun — sí, el mismo Yann LeCun que se convirtió en uno de los padres del aprendizaje profundo moderno y actualmente es Chief AI Scientist en Meta. El formato fue diseñado específicamente para comprimir documentos escaneados a ratios muy superiores a los que el PDF podía conseguir en aquel momento.
AT&T publicó DjVu como software libre en 2002 bajo la licencia GNU GPL. Esto permitió que grandes proyectos de bibliotecas digitales lo adoptaran de inmediato. El Internet Archive (archive.org) incorporó DjVu pronto para sus enormes iniciativas de digitalización de libros. Wikimedia Commons lo usa para documentos históricos y libros antiguos. Google Books usó DjVu en sus primeras fases de digitalización antes de pasar al PDF. Las bibliotecas académicas y públicas de Rusia, Europa del Este y partes de Asia se convirtieron en usuarios masivos del formato, una herencia todavía visible hoy.
La innovación técnica: compresión en tres capas
Lo que hace que DjVu sea genuinamente inteligente es su enfoque de la estructura documental. En lugar de tratar una página escaneada como una sola imagen (como hace el escaneado naïf a PDF), DjVu descompone cada página en tres capas distintas:
- Capa de primer plano — texto, líneas y detalles finos codificados a muy alta resolución (generalmente 300–600 PPP), usando un compresor wavelet llamado IW44.
- Capa de fondo — fotografías, degradados y regiones de color codificadas a resolución mucho menor (generalmente 100 PPP o menos), también con IW44 pero a ratios de compresión más agresivos.
- Capa de máscara — un mapa de bits binario (blanco/negro) que indica al renderizador qué píxeles pertenecen al primer plano y cuáles al fondo.
Esta separación es la idea clave. Un carácter de texto sobre un fondo blanco se beneficia de una codificación de primer plano de altísima resolución, pero necesita casi ningún dato de fondo. Una ilustración se beneficia de un fondo bien comprimido sin desperdiciar bits en una capa de texto de alta resolución. El codificador aplica cada estrategia de compresión solo donde importa.
Comparativa real de tamaños de archivo
Los resultados son espectaculares:
| Tipo de documento | DjVu | PDF (JBIG2) | TIFF escaneado bruto |
|---|---|---|---|
| Libro escaneado de 300 páginas | ~3 MB | ~30 MB | ~150 MB |
| Página escaneada individual (300 PPP) | ~15–40 KB | ~100–300 KB | ~500 KB |
| Página de revista con texto y foto | ~50–80 KB | ~200–400 KB | ~800 KB |
Una ventaja de tamaño de 5 a 10 veces sobre el PDF para documentos escaneados es lo habitual. Para libros escaneados con mucho texto, la ventaja puede superar las 20 veces comparado con un PDF escaneado con imágenes JPEG incrustadas.
Dónde se encuentran archivos DjVu hoy
A pesar de su relativa oscuridad en la informática cotidiana, los archivos DjVu son muy comunes en contextos específicos:
- Internet Archive (archive.org) — Millones de libros escaneados por el Archive están disponibles en formato DjVu junto a PDF y EPUB. El flujo de digitalización del Archive históricamente producía DjVu como formato archivístico principal.
- Wikimedia Commons — Periódicos históricos, mapas, manuscritos y publicaciones científicas antiguas se almacenan como archivos DjVu y se renderizan como miniaturas PNG para las páginas de Wikipedia.
- Google Books (era inicial) — El programa de digitalización inicial de Google a mediados de los 2000 produjo archivos DjVu para muchos libros. Las digitalizaciones posteriores pasaron al PDF.
- Bibliotecas digitales académicas — La Biblioteca Estatal Rusa (RSL), la Biblioteca Digital Nacional de la India y numerosos repositorios académicos de Europa del Este albergan extensas colecciones en DjVu.
Cómo abrir archivos DjVu
Abrir un archivo DjVu no es tan sencillo como hacer doble clic, ya que ningún sistema operativo principal incluye un visor DjVu nativo:
Windows:
- WinDjView — Ligero, rápido y gratuito. El visor DjVu más popular en Windows. Incluye miniaturas, marcadores y zoom.
- Sumatra PDF — Compatible con DjVu junto a PDF, EPUB y otros formatos. Excelente para visualización rápida.
- DjView4 — El visor de referencia oficial, multiplataforma, algo más pesado pero muy completo.
macOS:
- DjView4 — Disponible mediante Homebrew (
brew install djview4) o como compilación independiente. - No existe soporte nativo en macOS; convertir a PDF primero suele ser la opción más práctica.
Linux:
- Evince — El visor de documentos de GNOME admite DjVu de forma nativa en la mayoría de distribuciones.
- Okular — El visor de KDE también gestiona DjVu correctamente.
- El paquete
djvulibreproporciona tanto el visor como las herramientas de línea de comandos.
Navegador:
- djvu.js — Una extensión de navegador disponible para Firefox y Chrome que renderiza archivos DjVu directamente. Funciona bien para archivos individuales, pero no viene instalada en ningún sitio por defecto.
Android/iOS:
- EBookDroid (Android) — Compatible con DjVu entre muchos otros formatos. Muy popular entre usuarios que leen libros de archive.org en tabletas.
- iOS tiene soporte DjVu nativo muy limitado; se recomienda convertir a PDF primero.
Cómo convertir archivos DjVu
La herramienta principal para la conversión de DjVu es ddjvu, incluida en el paquete djvulibre disponible en todas las plataformas principales.
Convertir DjVu completo a PDF:
ddjvu -format=pdf entrada.djvu salida.pdf
Extraer una sola página como TIFF:
ddjvu -format=tiff -page=3 entrada.djvu pagina3.tiff
Extraer un rango de páginas:
ddjvu -format=tiff -page=1..10 entrada.djvu paginas1a10.tiff
Usando ImageMagick (si el delegado DjVu está instalado):
convert entrada.djvu salida.pdf
Para usuarios que prefieren una interfaz gráfica, WinDjView en Windows ofrece Archivo → Exportar como PDF, y DjView4 tiene una funcionalidad de exportación similar. Los conversores en línea gestionan bien archivos DjVu individuales si no quieres instalar software.
DjVu vs PDF para documentos escaneados
| Característica | DjVu | PDF (escaneado) |
|---|---|---|
| Tamaño de archivo para libros escaneados | Excelente (5–10x menor) | Moderado o deficiente |
| Soporte nativo en navegadores | Ninguno (requiere extensión) | Total (todos los navegadores modernos) |
| Soporte en móviles | Requiere EBookDroid o conversión | Nativo en iOS/Android |
| Capa de texto buscable | Compatible (si se hizo OCR) | Compatible |
| Impresión | Compatible mediante visores | Universal |
| Edición y anotaciones | Muy limitada | Buena (con Acrobat/Foxit) |
| Archivo a largo plazo | Aceptable | Existe el estándar PDF/A |
| Ecosistema y herramientas | De nicho | Ubicuo |
Por qué DjVu perdió la guerra de formatos
A pesar de su superioridad técnica para documentos escaneados, DjVu no logró convertirse en un estándar mayoritario. Las razones son principalmente de ecosistema y de momento histórico:
- Adobe Reader era gratuito y estaba en todos lados. Para 2005, casi todos los PC con Windows tenían Adobe Reader instalado. DjVu requería que los usuarios instalaran un visor separado.
- El PDF se convirtió en el estándar web. Los navegadores empezaron a integrar renderizadores de PDF. DjVu nunca logró esta integración.
- PDF/A para archivado. Las instituciones adoptaron PDF/A como estándar archivístico por contar con respaldo ISO (ISO 19005). DjVu no tiene una estandarización equivalente.
- AT&T publicó el código demasiado tarde. Para 2002, el PDF ya había ganado la batalla de la percepción. El software libre de DjVu no pudo superar cinco años de adopción de PDF.
Cuándo conservar DjVu y cuándo convertir a PDF
Conserva DjVu si:
- Descargas de archive.org solo para leer — los visores DjVu están disponibles y el menor tamaño importa en conexiones lentas.
- Almacenas una gran colección de libros escaneados y el espacio en disco es un factor importante.
- El DjVu de origen tiene una capa de texto/OCR de alta calidad que quieres preservar exactamente.
Convierte a PDF si:
- Necesitas compartir el documento con alguien sin conocimientos técnicos.
- Necesitas soporte de anotaciones, comentarios o firma digital.
- Vas a subir el documento a cualquier sistema de gestión documental o enviarlo por correo electrónico.
- La accesibilidad es una preocupación (PDF/UA tiene mejores herramientas de accesibilidad).
Para la mayoría de usuarios que encuentran un archivo DjVu de archive.org, la opción más práctica es convertirlo a PDF una sola vez y quedarse con el PDF.
Conversiones relacionadas
Conversiones frecuentes del catálogo: