Inspektor Unicode

Wklej tekst → tabela każdego code pointa. Hex, decimal, bajty UTF-8, kategoria. Wyłapuj niewidzialne znaki.

Do czego to służy?

"Dlaczego ten string nie porównuje się jako równy?" "Dlaczego ten username jest odrzucany jako już zajęty, choć wygląda na wolny?" "Dlaczego ta nazwa pliku łamie mi shell?" Odpowiedź prawie zawsze brzmi: bajty nie pasują do tego, co widzą oczy. Dwa znaki mogą wyglądać identycznie, ale być różnymi code pointami (łacińskie "a" vs cyryliczne "а"); whitespace może ukrywać non-breaking spaces, zero-width joinery albo right-to-left override'y; emoji może być jednym code pointem albo czterema. To narzędzie rozkłada dowolny tekst na poszczególne code pointy Unicode, z hex, decimal, sekwencją bajtów UTF-8, kategorią i nazwą, gdy znana.

Kiedy tego użyć

Czytanie wyjścia

Częste pułapki