ASCII Tablosu
0–127 tam ASCII referansı: ondalık, hex, ikilik, karakter ve HTML entity. Filtrelenebilir.
Bu ne işe yarar?
ASCII (American Standard Code for Information Interchange), rakamları, harfleri, noktalama işaretlerini ve bir avuç kontrol kodunu 0–127 tam sayıları üzerine eşleyen 128 karakterlik kodlama sistemidir. Her modern metin kodlamasının (UTF-8, Latin-1, Windows-1252) temelinde durur, bu yüzden değerleri bilmek bazen hayati önemde olur — bir ikilik dosyadaki kaçak byte'ı teşhis etmek, "her yazdırılabilir" için regex kurmak, hex dump okumak veya 0x0A mı yoksa 0x0D mi yeni satır hatırlamak için.
Ne zaman kullanılır
- Hex dump okuyup o byte'ların ne dediğini anlamaya çalışırken.
- Parser yazıp sınır değerlerine ihtiyaç duyduğunda:
0x20(boşluk),0x7E(tilde) — yazdırılabilir aralık. 0x09(Tab) veya0x1F(Unit Separator) içerdiği için bozulan bir CSV'yi debug ederken.- Zorlu bir karakter için HTML entity üretirken —
A=A. 'in 0x0D (evet — Carriage Return) ve'in 0x0A (evet — Line Feed) olduğu konusundaki bir tartışmayı bitirirken.
Sık yapılan hatalar
- ASCII 7-bit'tir, 8-bit değil. 128–255 kodları ASCII değildir — belgenin beyan ettiği 8-bit kodlamaya (Latin-1, CP-1252, …) aittirler veya UTF-8 dizisinin lead byte'larıdır.
- Yeni satırlar platforma göre farklılaşır. Unix/macOS sadece
LF(0x0A); eski Mac ClassicCR(0x0D) kullandı; WindowsCRLFkullanır. Karışık dosyalar naif satır sayımını bozar. - Kontrol karakterleri görünmez sabotajcılar olabilir. Terminal veya PDF'ten kopyala/yapıştır
0x1F,0x07(BEL — gerçekten terminali ötürür) veya ASCII olmayan sıfır-genişlik Unicode karakterleri yakalayabilir. Metin "iyi görünüyor" ama eşit karşılaştırmıyorsa, byte'lara dök. - HTML entity'ler her zaman gerekli değildir. Modern UTF-8 belgelerinde,
Ave literalAeşdeğerdir. Yalnızca HTML'de sözdizimsel anlamı olan karakterleri escape et:&,<,>ve nitelik içinde". - NUL (
0x00) C'de string'leri sonlandırır. C-string buffer'larına düşünmeden gömme — birçok API ilk NUL'da sessizce keser.