Unicode インスペクター

テキストを貼ると各コードポイントを一覧表示。hex、10 進、UTF-8 バイト、カテゴリ。不可視文字も発見。

用途

「なぜ等しいはずの文字列が一致しない?」「空いてそうなのに既存と判定されるユーザー名」「ファイル名がシェルで壊れる理由は?」 答えはたいてい、目には同じに見えてもバイトが違うからです。ラテンの "a" とキリルの "а" は同じに見えても別のコードポイントです。空白には no-break space、zero-width joiner、right-to-left override が混じることがあります。絵文字は 1 個のコードポイントで構成されることもあれば、4 個のこともあります。本ツールは任意のテキストを各 Unicode コードポイントに分解し、hex、10 進、UTF-8 バイト列、カテゴリ、既知ならば名称も表示します。

使うべきタイミング

出力の読み方

よくある注意点