Saltar al contenido principal
Convertidor de imágenes Convertidor de vídeo Convertidor de audio Convertidor de documentos
Herramientas Guías Formatos Precios API
Iniciar sesión
🇬🇧 English 🇧🇷 Português 🇩🇪 Deutsch
Guía

Formato JSON: Guía Técnica Completa

PC Por Pablo Cirre

Preguntas frecuentes

JSON es un formato de texto — una cadena. Los objetos JavaScript son estructuras de datos en memoria. Tienen diferencias clave: JSON requiere claves entre comillas dobles, JSON no tiene tipo undefined, JSON no admite funciones, comentarios ni comas finales, y JSON no tiene tipo Date (las fechas son cadenas). Un objeto JavaScript puede serializarse a JSON con JSON.stringify() y analizarse de vuelta con JSON.parse(). JSON también es independiente del lenguaje — Python, Ruby, Java, PHP tienen soporte JSON nativo.

Envía <strong>PDF</strong> cuando el documento es final y el layout debe preservarse tal cual (contratos, facturas, certificados). Envía <strong>DOCX</strong> cuando los revisores deben editar, comentar o usar control de cambios. Muchos equipos envían ambos: PDF como versión canónica + DOCX para feedback editable. PDF/A es el adecuado para archivado legal (ISO 19005).

JSON es típicamente un 30–40% más pequeño que el XML equivalente (sin etiquetas de cierre, sin sobrecarga de sintaxis de atributos). JSON se mapea directamente a estructuras de datos nativas en la mayoría de lenguajes (objetos, arrays, cadenas, números). JSON.parse() y JSON.stringify() están integrados en todos los navegadores modernos. Para las APIs RESTful y los servicios web, JSON se ha convertido en el estándar de facto desde ~2010, reemplazando en gran medida al SOAP basado en XML.

Round-trip entre formatos similares (DOCX ↔ ODT, DOCX → PDF) suele ser seguro. Round-trip con funciones específicas del formato (macros de Word, tablas complejas, notas al pie) suele perder fidelidad. Las fuentes incrustadas sobreviven solo si origen y destino lo soportan (PDF sí, DOCX sí, HTML plano no). Previsualiza siempre antes de borrar el original.

Con jq: `jq "." minificado.json` embellece, `jq -c "." embellecido.json` minifica. Con Python: `python3 -m json.tool embellecido.json` produce JSON embellecido, `python3 -m json.tool --compact embellecido.json` minifica. En JavaScript: `JSON.stringify(datos, null, 2)` para embellecido con 2 espacios, `JSON.stringify(datos)` para minificado. Minificar respuestas de API JSON reduce el tamaño del payload un 20–40% antes de la compresión.

Si el PDF contiene texto real (no imágenes escaneadas), <code>pdftotext</code> de poppler-utils o <a href="/es/convert/pdf-a-txt">PDF a TXT</a> funcionan en segundos. Si el PDF es escaneado, necesitas OCR — Tesseract es el estándar open-source. Las herramientas PDF de KaijuConverter detectan automáticamente texto vs. imagen y enrutan según el caso.

Limitaciones clave: (1) Sin comentarios — JSON solo contiene datos; usa JSONC o YAML para archivos de configuración anotados. (2) Sin tipo de fecha — las fechas deben serializarse como cadenas ISO 8601. (3) Sin datos binarios — el binario debe codificarse en base64, aumentando el tamaño un 33%. (4) Pérdida de precisión numérica — los enteros > 2^53 pierden precisión en IEEE 754 double. (5) Sin comas finales — editar JSON a mano es propenso a errores. (6) Sin aplicación de esquema en el momento del análisis — requiere paso de validación separado.

Edición ligera (anotaciones, firmas, campos de formulario) es viable en cualquier lector PDF. Edición estructural (cambiar párrafos, reemplazar imágenes) es incómoda — PDF es un formato de presentación, no de edición. El flujo robusto es: mantén el origen DOCX/MD/HTML como máster y regenera el PDF cuando haya cambios. Las herramientas que "editan PDF" hacen ingeniería inversa del layout y suelen romperlo.