Visualizzatore JSONL
Visualizza file JSONL (JSON delimitato da newline) in una tabella paginata. Incolla fino a migliaia di righe, cerca, filtra, espandi singoli record. I file non lasciano mai il browser.
A cosa serve?
JSONL (anche NDJSON — JSON delimitato da newline) è il formato de facto per dati di training LLM, audit log, stream di eventi e output di API batch. Un oggetto JSON per riga, senza array contenitore. Append-friendly, si parsa riga per riga, sopravvive a corruzione parziale. Leggerlo da umano è doloroso però — vuoi una tabella, non un muro di parentesi. Questo strumento ti dà quella tabella nel browser. Nulla viene caricato; il file viene letto col FileReader del browser e parsato sul posto.
Quando usarlo
- Ispezionare dati di training LLM. Un dataset di fine-tuning è tipicamente
{"messages": [...]}per riga. Sfogliare il corpus, controllare il bilancio delle classi, trovare la riga outlier che sta facendo fallire il tuo trainer. - Leggere output batch di OpenAI / Anthropic. Entrambi tornano risultati batch come JSONL — una riga per richiesta, con status e contenuto. Vedere a colpo d'occhio quali richieste sono andate.
- Revisionare audit log. Log applicativi in JSONL sono comuni; questo strumento li mostra come tabella per analisi ad hoc senza lasciare il browser.
- Sanity-check di stream di eventi. Dump Kafka / Kinesis arrivano spesso come JSONL. Vista paginata veloce, senza jq.
- Convertire JSONL → CSV. Usa il pulsante export quando vuoi versare i dati in un foglio di calcolo.
Come funziona il parsing
- Ogni riga non vuota viene parsata indipendentemente come JSON. Le righe vuote sono ignorate.
- Se una riga fallisce, appare come riga rossa con l'errore — il resto del file continua. Intenzionale: una riga rotta non deve costarti le altre mille.
- Le colonne sono auto-rilevate dall'unione delle chiavi nelle prime 100 righe valide, ordinate per frequenza. Chiavi rare oltre la riga 100 restano nei dati ma non avranno colonna propria.
- Oggetti e array annidati appaiono come snippet JSON troncato nella cella. Clicca la riga per vedere il JSON pretty-printed completo.
Trappole comuni
- Array JSON ≠ JSONL. Se il tuo file sembra
[{...}, {...}, {...}]con virgole, è un array JSON, non JSONL. Togli le parentesi esterne e sostituisci le virgole con newline — o usa un visualizzatore JSON. - JSON pretty-printed non è JSONL. Se ogni "oggetto" si stende su più righe, il parser vedrà frammenti rotti. JSONL è strettamente un oggetto per riga.
- Righe a forma mista vanno bene ma sporcano. Se metà delle tue righe hanno
contente l'altra metàtext, avrai due colonne e tanti vuoti. Spesso è quello che vuoi; a volte segnala un bug di pulizia dati. - File molto grandi. Tutto viene parsato in memoria; ~50–100 MB va bene su laptop moderni, oltre rallenta. Per log multi-gigabyte, usa uno strumento CLI in streaming.
- Privacy. I file non lasciano mai la pagina. FileReader legge byte in memoria JS; nessuna richiesta di rete.