JSONL Görüntüleyici
JSONL (satır ayrılmış JSON) dosyalarını sayfalı tabloda görüntüle. Binlerce satıra kadar yapıştır, ara, filtrele, kayıtları ayrı ayrı genişlet. Dosyalar tarayıcından asla çıkmaz.
Bu ne işe yarar?
JSONL (NDJSON da denir — yeni satırlarla ayrılmış JSON), LLM eğitim verisi, audit log'ları, event stream'leri ve batch API çıktıları için fiili formattır. Satır başına bir JSON nesnesi, dış sarmalayıcı array yok. Append-dostu, satır satır parse edilir, kısmi bozulmaya dayanır. Ama insan olarak okumak acı verici — süslü parantez duvarı yerine tablo istiyorsun. Bu araç o tabloyu tarayıcında verir. Hiçbir şey yüklenmez; dosya tarayıcının FileReader'ı ile okunur ve yerinde parse edilir.
Ne zaman kullanılır
- LLM eğitim verisini inceleme. Bir fine-tuning dataset'i tipik olarak satır başına
{"messages": [...]}'dur. Külliyatı tarayıp sınıf dengesini kontrol et, trainer'ını çökerten o tek aykırı satırı bul. - OpenAI / Anthropic batch çıktılarını okuma. İkisi de batch sonuçlarını JSONL olarak döner — istek başına bir satır, statü ve içerik. Hangi isteklerin başardığını bir bakışta gör.
- Audit log'ları gözden geçirme. JSONL'daki uygulama log'ları yaygındır; bu araç onları tarayıcıdan çıkmadan, ad hoc analiz için tabloda gösterir.
- Event stream sanity check. Kafka / Kinesis dump'ları sık sık JSONL gelir. Hızlı sayfalı görüntü, jq olmadan.
- JSONL → CSV dönüşümü. Veriyi bir hesap tablosuna atmak istediğinde export düğmesini kullan.
Parsing nasıl çalışır
- Boş olmayan her satır JSON olarak bağımsız parse edilir. Boş satırlar yok sayılır.
- Bir satır başarısız olursa parse hatasıyla kırmızı satır olarak görünür — dosyanın geri kalanı devam eder. Bilinçli: bir bozuk satır seni diğer binini kaybetmemeli.
- Sütunlar, ilk 100 geçerli satırdaki anahtarların birleşiminden, görülme sıklığına göre sıralanarak otomatik tespit edilir. 100. satırdan sonraki nadir anahtarlar veride kalır ama kendi sütununu almaz.
- İç içe nesneler ve diziler hücrelerinde kırpılmış JSON parçası olarak gösterilir. Satıra tıkla, tam pretty-printed JSON'u gör.
Yaygın tuzaklar
- JSON dizisi ≠ JSONL. Dosyan
[{...}, {...}, {...}]gibi virgüllü görünüyorsa, bu bir JSON dizisidir, JSONL değil. Dış parantezleri kaldır ve virgülleri yeni satırla değiştir — veya bir JSON görüntüleyici kullan. - Pretty-printed JSON, JSONL değildir. Her "nesne" birden fazla satıra yayılırsa, parser kırık parçalar görür. JSONL kesinlikle satır başına bir nesnedir.
- Karışık şekilli satırlar olur ama dağınık görünür. Satırlarının yarısı
content, diğer yarısıtextiçeriyorsa, iki sütun ve çok boşluk alacaksın. Çoğu zaman istediğin budur; bazen veri temizleme bug'ının işaretidir. - Çok büyük dosyalar. Her şey bellekte parse edilir; modern dizüstülerde ~50–100 MB sorun değil, ötesinde yavaşlar. Çoklu GB log'lar için bir streaming CLI aracı kullan.
- Gizlilik. Dosyalar sayfayı asla terk etmez. FileReader byte'ları JS belleğine okur; ağ isteği yapılmaz.