JSONL Viewer
JSONL (newline-delimited JSON) files को paginated table में देखें। हज़ारों lines तक paste करें, search करें, filter करें, individual records expand करें। Files कभी आपके browser से बाहर नहीं जातीं।
यह किसके लिए है?
JSONL (जिसे NDJSON भी कहते हैं — newline-delimited JSON) LLM training data, audit logs, event streams, और batch API outputs के लिए de facto format है। प्रति line एक JSON object, कोई enclosing array नहीं। Append-friendly, line-by-line parse होता है, और partial corruption को झेल लेता है। पर इसे human के तौर पर पढ़ना दर्दनाक है — आप table चाहते हैं, curly braces की दीवार नहीं। यह tool वह table आपके browser में देता है। कुछ upload नहीं होता; file को browser के FileReader से पढ़ा और तुरंत parse किया जाता है।
कब इस्तेमाल करें
- LLM training data inspect करने के लिए। Fine-tuning dataset आम तौर पर per line
{"messages": [...]}होता है। Corpus skim करें, class balance देखें, वह एक outlier row ढूँढें जो आपके trainer को fail कर रही है। - OpenAI / Anthropic batch outputs पढ़ने के लिए। दोनों provider batch results JSONL में लौटाते हैं — per request एक line, status और content सहित। एक नज़र में देखें कौन से requests सफल हुए।
- Audit logs review करने के लिए। JSONL में application logs आम हैं; यह tool उन्हें ad-hoc analysis के लिए table में दिखाता है, browser छोड़े बिना।
- Event streams की sanity-check। Kafka / Kinesis dumps अक्सर JSONL में आते हैं। Quick paginated view, jq की ज़रूरत नहीं।
- JSONL → CSV में convert करना। Export button का use करें जब डेटा को spreadsheet में डालना हो।
Parsing कैसे काम करता है
- हर non-empty line को independent JSON के रूप में parse किया जाता है। Empty lines ignore होती हैं।
- अगर एक line parse में fail हो, तो वह red row के रूप में parse error के साथ दिखती है — बाकी file चलती रहती है। यह जान-बूझकर है: एक खराब line से बाकी हज़ार नहीं खोनी चाहिए।
- Columns पहले 100 valid rows की keys के union से auto-detect होती हैं, frequency के आधार पर sorted। Row 100 के बाद की rare keys data में रहती हैं पर अपना column नहीं मिलता।
- Nested objects और arrays अपने cell में clipped JSON snippet के रूप में दिखते हैं। Row पर click करें full pretty-printed JSON देखने के लिए।
आम गलतियाँ
- JSON array ≠ JSONL। अगर आपकी file
[{...}, {...}, {...}]जैसी commas के साथ दिखती है, वह JSON array है, JSONL नहीं। बाहरी brackets हटाएँ और commas को newlines से बदलें — या JSON viewer use करें। - Pretty-printed JSON JSONL नहीं है। अगर हर "object" कई lines में फैला है, parser टूटे fragments देखेगा। JSONL सख्ती से per line एक object है।
- Mixed-shape rows चलती हैं पर गंदगी होती है। अगर आधी rows में
contentहै और दूसरी आधी मेंtext, आपको दो columns और बहुत खाली cells मिलेंगी। अक्सर यही आप चाहते हैं; कभी-कभी यह data-cleanup bug का संकेत होता है। - बहुत बड़ी files। सब memory में parse होता है; ~50–100 MB modern laptops पर ठीक है, उससे ज़्यादा पर slow। Multi-gigabyte logs के लिए streaming CLI tool इस्तेमाल करें।
- Privacy। Files page कभी नहीं छोड़तीं। FileReader bytes JS memory में पढ़ता है; कोई network request नहीं।