JSONL prohlížeč
Zobraz JSONL (JSON oddělený novými řádky) soubory ve stránkované tabulce. Vlož tisíce řádků, hledej, filtruj, rozbal jednotlivé záznamy. Soubory nikdy neopustí tvůj prohlížeč.
K čemu to slouží?
JSONL (také NDJSON — JSON oddělený novými řádky) je de facto formát pro trénovací data LLM, audit logy, eventové streamy a výstupy batch API. Jeden JSON objekt na řádek, žádné obklopující pole. Append-friendly, parsuje se řádek po řádku, přežije částečnou korupci. Číst ho jako člověk ale bolí — chceš tabulku, ne zeď složených závorek. Tenhle nástroj ti dá tu tabulku v prohlížeči. Nic se nenahrává; soubor se čte přes FileReader prohlížeče a parsuje na místě.
Kdy to použít
- Kontrola trénovacích dat LLM. Dataset na fine-tuning je typicky
{"messages": [...]}na řádek. Projít korpus, ověřit vyváženost tříd, najít tu jednu outlier řádku, která ti shazuje trainer. - Čtení batch výstupů OpenAI / Anthropic. Oba vracejí batch výsledky jako JSONL — jeden řádek na request, se statusem a obsahem. Na první pohled uvidíš, které requesty prošly.
- Review audit logů. Aplikační logy v JSONL jsou běžné; tento nástroj je zobrazí jako tabulku na ad-hoc analýzu bez opuštění prohlížeče.
- Sanity-check eventových streamů. Kafka / Kinesis dumpy často chodí jako JSONL. Rychlý stránkovaný pohled, bez jq.
- Konverze JSONL → CSV. Použij export tlačítko, když chceš nasypat data do tabulky.
Jak parsování funguje
- Každý neprázdný řádek se parsuje nezávisle jako JSON. Prázdné řádky se ignorují.
- Pokud řádek selže, objeví se jako červený řádek s chybou parseru — zbytek souboru pokračuje. Záměrně: jeden špatný řádek nemá stát další tisícovku.
- Sloupce se autodetekují z unie klíčů v prvních 100 platných řádcích, seřazené podle frekvence. Vzácné klíče po 100. řádku zůstanou v datech, ale nedostanou vlastní sloupec.
- Vnořené objekty a pole se v buňce zobrazí jako oříznutý JSON snippet. Klikni na řádek, abys viděl plný pretty-printed JSON.
Časté pasti
- JSON pole ≠ JSONL. Pokud tvůj soubor vypadá jako
[{...}, {...}, {...}]s čárkami mezi objekty, je to JSON pole, ne JSONL. Odstraň vnější závorky a nahraď čárky novými řádky — nebo použij JSON prohlížeč. - Pretty-printed JSON není JSONL. Pokud se každý „objekt" táhne přes víc řádků, parser uvidí rozbité fragmenty. JSONL je striktně jeden objekt na řádek.
- Smíšené tvary řádků jsou v pořádku, ale nepořádné. Pokud má polovina řádků
contenta druhátext, dostaneš dva sloupce a hodně prázdných míst. Často to chceš; někdy to ukazuje na bug v čištění dat. - Velmi velké soubory. Vše se parsuje v paměti; ~50–100 MB je v pohodě na moderních laptopech, víc začne zpomalovat. Pro logy v gigabajtech použij streamovací CLI nástroj.
- Soukromí. Soubory nikdy neopustí stránku. FileReader čte bajty do JS paměti; žádný síťový request.