Visor JSONL
Visualiza archivos JSONL (JSON delimitado por líneas) en una tabla paginada. Pega hasta miles de líneas, busca, filtra, expande registros individuales. Los archivos nunca salen de tu navegador.
¿Para qué sirve?
JSONL (también NDJSON — JSON delimitado por línea) es el formato de facto para datos de entrenamiento de LLM, logs de auditoría, streams de eventos y outputs de APIs batch. Un objeto JSON por línea, sin array contenedor. Es amigable para append, se parsea línea a línea y sobrevive a corrupción parcial. Leerlo como humano duele — quieres una tabla, no un muro de llaves. Esta herramienta te da esa tabla en el navegador. Nada se sube; el archivo se lee con FileReader y se parsea en el sitio.
Cuándo usarla
- Inspeccionar datos de training de LLM. Un dataset de fine-tuning suele ser
{"messages": [...]}por línea. Hojear el corpus, comprobar balance de clases, encontrar la fila outlier que está rompiendo tu trainer. - Leer outputs batch de OpenAI / Anthropic. Ambos devuelven resultados batch como JSONL — una línea por request, con status y contenido. Ver de un vistazo qué requests salieron bien.
- Revisar logs de auditoría. Logs de aplicación en JSONL son comunes; esta herramienta los presenta como tabla para análisis ad-hoc sin salir del navegador.
- Sanity-check de event streams. Dumps de Kafka / Kinesis suelen llegar como JSONL. Vista paginada rápida, sin jq.
- Convertir JSONL → CSV. Usa el botón de export cuando quieras meter los datos en una hoja de cálculo.
Cómo funciona el parsing
- Cada línea no vacía se parsea independientemente como JSON. Líneas vacías se ignoran.
- Si una línea falla, aparece como fila roja con el error — el resto del archivo continúa. Intencional: una línea mala no debería perder las otras mil.
- Las columnas se auto-detectan de la unión de keys en las primeras 100 filas válidas, ordenadas por frecuencia. Keys raras pasadas la fila 100 siguen en los datos pero no tendrán columna propia.
- Objetos y arrays anidados se muestran como snippet JSON recortado en su celda. Haz click en la fila para ver el JSON pretty-printed completo.
Errores comunes
- Array JSON ≠ JSONL. Si tu archivo se ve como
[{...}, {...}, {...}]con comas, eso es un array JSON, no JSONL. Quita los corchetes externos y cambia comas por saltos de línea — o usa un visor JSON. - JSON pretty-printed no es JSONL. Si cada "objeto" abarca varias líneas, el parser verá fragmentos rotos. JSONL es estrictamente un objeto por línea.
- Filas con shape mixto van bien pero quedan desordenadas. Si la mitad de tus filas tienen
contenty la otra mitadtext, vas a tener dos columnas y muchos huecos. A menudo eso es lo que quieres; a veces señala un bug de limpieza de datos. - Archivos muy grandes. Todo se parsea en memoria; ~50–100 MB va bien en laptops modernos, más allá se ralentiza. Para logs de varios GB, usa una herramienta CLI de streaming.
- Privacidad. Los archivos nunca salen de la página. FileReader lee bytes a memoria JS; no se hace request de red.