Saltar al contenido principal
Convertidor de imágenes Convertidor de vídeo Convertidor de audio Convertidor de documentos
Herramientas Guías Formatos Precios API
Iniciar sesión
🇬🇧 English 🇧🇷 Português 🇩🇪 Deutsch
Guía

Guía del formato DjVu: Documentos escaneados comprimidos y bibliotecas digitales

PC Por Pablo Cirre

Preguntas frecuentes

DjVu es un formato de documento diseñado para páginas escaneadas con contenido mixto (texto, fotos y arte lineal). Su pequeño tamaño de archivo proviene de una inteligente separación en tres capas: (1) la capa JB2 almacena texto y arte lineal como una imagen bitonal (blanco/negro) usando coincidencia de patrones — la misma forma de carácter (como la letra "e") se almacena una vez y se referencia por posición donde aparece, logrando una compresión extrema para texto; (2) la capa wavelet IW44 almacena el fondo en color/escala de grises; (3) un diccionario compartido entre todas las páginas significa que los caracteres comunes se almacenan solo una vez por documento. Una página de texto escaneada a 300 DPI logra 20-100 KB en DjVu frente a 1-3 MB en TIFF.

En KaijuConverter cada archivo se procesa en un contenedor aislado, cifrado en tránsito (TLS 1.3) y en reposo, y se elimina automáticamente tras 60 minutos con sobrescritura multi-pass. Nunca entrenamos modelos con, compartimos ni analizamos contenido de usuarios. Para máxima privacidad en material extremadamente sensible, usa herramientas offline (ImageMagick, FFmpeg, LibreOffice) bajo tu control.

DjVu no tiene soporte nativo en la mayoría de sistemas operativos o navegadores. En Windows, Sumatra PDF (gratuito, ligero) y WinDjView abren DjVu de forma nativa. En macOS, DjView (gratuito, del proyecto DjVuLibre) funciona bien. En Linux, Evince y Okular soportan DjVu. Para una conversión rápida sin instalar software, usa la herramienta de línea de comandos `ddjvu` (del paquete djvulibre): `ddjvu -format=pdf entrada.djvu salida.pdf` convierte a PDF que se abre en cualquier visor PDF. Internet Archive (archive.org) proporciona DjVu.js — un visor basado en navegador integrado en su visor de libros.

En el 95% de casos sí — ImageMagick, FFmpeg y LibreOffice en servidor producen resultados idénticos a los de tu equipo. Escritorio gana para: archivos muy grandes (varios GB), lotes de miles de archivos, pipelines automatizados o contenido demasiado sensible para subir. KaijuConverter admite hasta 500 MB por archivo (1 GB en planes de pago).

La herramienta estándar es `ddjvu` del paquete DjVuLibre: instalar en Ubuntu con `apt install djvulibre-bin`, en macOS con `brew install djvulibre`. Luego: `ddjvu -format=pdf entrada.djvu salida.pdf`. Para documentos multipágina con un DPI específico: `ddjvu -format=pdf -resolution=300 entrada.djvu salida.pdf`. Para extraer páginas específicas: `ddjvu -format=pdf -page=1-50 entrada.djvu paginas_1-50.pdf`. Las herramientas en línea (Zamzar, Convertio) también convierten DjVu a PDF sin instalación de software. Ten en cuenta que el PDF resultante contiene imágenes (no texto PDF nativo), igual que el DjVu original.

La mayoría de conversiones de formato son lossy por diseño — JPG, MP3, MP4, WebP descartan información perceptual para reducir tamaño. Pasar por intermedios lossy multiplica la pérdida. Para minimizar el drift: convierte desde el máster original, sube la calidad y evita ir y volver entre formatos lossy.

La fuente más grande es Internet Archive (archive.org) — busca libros, revistas o manuales técnicos y busca la opción de descarga DjVu (generalmente junto con PDF, EPUB y texto plano). Muchos libros de dominio público, revistas científicas y documentos históricos están disponibles. Los sitios en ruso (lib.ru, djvu.org) tienen extensas colecciones técnicas y literarias en DjVu. Para retro computing: los escaneos de revistas de informática vintage (Byte, PCWorld, Dr. Dobb's) se encuentran frecuentemente en formato DjVu en sitios de archivo.

Sí — KaijuConverter acepta varios archivos a la vez y devuelve un ZIP. Para lotes muy grandes (miles de archivos) usa herramientas de línea de comandos o nuestra API: <code>find . -name "*.heic" -exec magick {} {.}.jpg \;</code> y one-liners similares escalan a millones de archivos en local.