JSONL prehliadač
Zobraz JSONL (JSON oddelený novými riadkami) súbory v stránkovanej tabuľke. Vlož tisíce riadkov, hľadaj, filtruj, rozbaľ jednotlivé záznamy. Súbory nikdy neopustia tvoj prehliadač.
Načo to slúži?
JSONL (tiež NDJSON — JSON oddelený novými riadkami) je de facto formát pre tréningové dáta LLM, audit logy, eventové streamy a výstupy batch API. Jeden JSON objekt na riadok, žiadne obklopujúce pole. Príjemný na append, parsuje sa riadok po riadku, prežije čiastočnú korupciu. Čítať ho ako človek však bolí — chceš tabuľku, nie stenu zložených zátvoriek. Tento nástroj ti dá tú tabuľku v prehliadači. Nič sa nenahráva; súbor sa číta cez FileReader prehliadača a parsuje na mieste.
Kedy to použiť
- Kontrola tréningových dát LLM. Dataset na fine-tuning je typicky
{"messages": [...]}na riadok. Prekrolovať korpus, skontrolovať vyváženosť tried, nájsť tú jednu outlier riadku, ktorá ti rúca trainer. - Čítanie batch výstupov OpenAI / Anthropic. Obaja vracajú batch výsledky ako JSONL — jeden riadok na request, so statusom a obsahom. Na prvý pohľad uvidíš, ktoré requesty prešli.
- Review audit logov. Aplikačné logy v JSONL sú bežné; tento nástroj ich zobrazí ako tabuľku na ad-hoc analýzu bez opustenia prehliadača.
- Sanity-check eventových streamov. Kafka / Kinesis dumpy často chodia ako JSONL. Rýchly stránkovaný pohľad, bez jq.
- Konverzia JSONL → CSV. Použi export tlačidlo, keď chceš hodiť dáta do tabuľky.
Ako funguje parsovanie
- Každý neprázdny riadok sa parsuje nezávisle ako JSON. Prázdne riadky sa ignorujú.
- Ak riadok zlyhá, objaví sa ako červený riadok s chybou parsera — zvyšok súboru pokračuje. Zámerne: jeden zlý riadok nemá stáť ďalšiu tisícku.
- Stĺpce sa autodetekujú z únie kľúčov v prvých 100 platných riadkoch, zoradené podľa frekvencie. Vzácne kľúče po 100. riadku zostanú v dátach, ale nedostanú vlastný stĺpec.
- Vnorené objekty a polia sa v bunke zobrazia ako orezaný JSON snippet. Klikni na riadok, aby si videl plný pretty-printed JSON.
Časté pasce
- JSON pole ≠ JSONL. Ak tvoj súbor vyzerá ako
[{...}, {...}, {...}]s čiarkami medzi objektmi, je to JSON pole, nie JSONL. Odstráň vonkajšie zátvorky a nahraď čiarky novými riadkami — alebo použi JSON prehliadač. - Pretty-printed JSON nie je JSONL. Ak sa každý „objekt" tiahne cez viac riadkov, parser uvidí pokazené fragmenty. JSONL je striktne jeden objekt na riadok.
- Zmiešané tvary riadkov sú v poriadku, ale neporiadne. Ak má polovica riadkov
contenta druhátext, dostaneš dva stĺpce a veľa prázdnych miest. Často to chceš; niekedy to ukazuje na bug v čistení dát. - Veľmi veľké súbory. Všetko sa parsuje v pamäti; ~50–100 MB je v pohode na moderných laptopoch, viac začne spomaľovať. Pre logy v gigabajtoch použi streamovací CLI nástroj.
- Súkromie. Súbory nikdy neopustia stránku. FileReader číta bajty do JS pamäte; žiadny sieťový request.