Visualiseur JSONL
Affichez des fichiers JSONL (JSON délimité par lignes) dans un tableau paginé. Collez jusqu'à des milliers de lignes, recherchez, filtrez, dépliez chaque enregistrement. Les fichiers ne quittent jamais votre navigateur.
À quoi ça sert ?
JSONL (aussi NDJSON — JSON délimité par lignes) est le format de facto pour les données d'entraînement LLM, les logs d'audit, les flux d'événements et les sorties d'API batch. Un objet JSON par ligne, pas de tableau englobant. Pratique pour l'append, se parse ligne par ligne, survit à la corruption partielle. Le lire en tant qu'humain est pénible — vous voulez un tableau, pas un mur d'accolades. Cet outil vous donne ce tableau dans le navigateur. Rien n'est uploadé ; le fichier est lu avec FileReader et parsé sur place.
Quand l'utiliser
- Inspecter des données de training LLM. Un dataset de fine-tuning, c'est typiquement
{"messages": [...]}par ligne. Survoler le corpus, vérifier l'équilibre des classes, trouver la ligne aberrante qui fait planter votre entraîneur. - Lire les sorties batch d'OpenAI / Anthropic. Les deux retournent les résultats batch en JSONL — une ligne par requête, avec statut et contenu. Voir d'un coup quelles requêtes ont réussi.
- Reviewer des logs d'audit. Les logs applicatifs en JSONL sont courants ; cet outil les présente en tableau pour analyse ad hoc sans quitter le navigateur.
- Sanity-check de flux d'événements. Les dumps Kafka / Kinesis arrivent souvent en JSONL. Vue paginée rapide, sans jq.
- Convertir JSONL → CSV. Utilisez le bouton d'export quand vous voulez déposer les données dans un tableur.
Comment marche le parsing
- Chaque ligne non vide est parsée indépendamment en JSON. Les lignes vides sont ignorées.
- Si une ligne échoue, elle apparaît en rouge avec l'erreur — le reste du fichier continue. Intentionnel : une mauvaise ligne ne doit pas vous coûter les autres milliers.
- Les colonnes sont auto-détectées à partir de l'union des clés dans les 100 premières lignes valides, triées par fréquence. Les clés rares au-delà de la ligne 100 restent dans les données mais n'auront pas leur propre colonne.
- Objets et tableaux imbriqués s'affichent en snippet JSON tronqué dans leur cellule. Cliquez la ligne pour voir le JSON pretty-printed complet.
Pièges courants
- Tableau JSON ≠ JSONL. Si votre fichier ressemble à
[{...}, {...}, {...}]avec des virgules, c'est un tableau JSON, pas du JSONL. Retirez les crochets externes et remplacez les virgules par des sauts de ligne — ou utilisez un visualiseur JSON. - JSON pretty-printed n'est pas du JSONL. Si chaque « objet » s'étale sur plusieurs lignes, le parser ne voit que des fragments cassés. JSONL = strictement un objet par ligne.
- Lignes de formes mélangées : ça marche mais c'est moche. Si la moitié de vos lignes ont
contentet l'autretext, vous obtenez deux colonnes et plein de cases vides. Souvent c'est ce que vous voulez ; parfois c'est le signe d'un bug de nettoyage de données. - Très gros fichiers. Tout est parsé en mémoire ; ~50–100 Mo passe sur un laptop moderne, au-delà ça ralentit. Pour des logs de plusieurs Go, prenez un outil CLI en streaming.
- Confidentialité. Les fichiers ne quittent jamais la page. FileReader lit les octets en mémoire JS ; aucune requête réseau.