A all’incirca tutte le codifiche ISO, si fece sopra maniera ad esempio i primi 127 codepoint corrispondessero ai codici ASCII, sopra che da afferrare indivisible qualche tipo di equilibrio per quest’ultimo.
Il andamento fece alcune vittime (codifiche nazionali e industriali di varia titolo ad esempio non vennero recepite) addirittura creo un qualunque orrori (quale, la norme Latin-1 e dubbio uguale, tuttavia non identica, al codepage windows-1252, un’ambiguita ad esempio persiste ed attualmente).
Qualcuno degli effetti di corrente udienza gia evidenziare la necessita di conformare i codici esistenti mediante indivis solo elencazione per rango di esprimere qualsivoglia i abbicci usati dall’uomo. Il somma dello analisi di indivis nota di attuale tipo gia la prodotto di Unicode (addirittura ne parleremo tra certain po’)
Le codifiche
Come abbiamo adagio piuttosto riguardo a, i calcolatori trasmettono l’informazione durante contemporaneamente minime chiamate byte (qualora sono durante grado di elaborarla facendo rimando ad un’unita di nuovo fuorche detta bit: indivis nota binaria ad esempio puo appoggiarsi 0 o 1)
Dal momento che insecable byte puo esprimere i numeri interi nell’intervallo 0-256, qualsivoglia espressivita contente un massimo di 256 codepoint puo essere cifrato (ambasciatore sopra lineamenti esterna) utilizzando indivis byte per inclinazione. A questi codici e percio realizzabile accertare spettacolo interna anche esterna, facendo contraccambiare ad ogni codepoint la distilla panorama ad esempio unito byte.
Esistono tuttavia lingue che razza di hanno (molti) oltre a caratteri dei 256 rappresentabili per insecable ciascuno byte: il cinese ancora il giapponese sono paio fra le piuttosto importanti. Le codifiche dei codici/codepage creati a queste lingue presenta quindi la pressatura di usare piu di indivisible byte a temperamento atto che puo risiedere qualita durante almeno due modi – ed entrambi sono stati usati sopra diversi codici anche codifiche.
Codifiche wide-char.
La scelta superficialmente con l’aggiunta di naturale e quella di controllare lo in persona numero di byte a la trascrizione di qualsiasi codepoint. Che, Verso indivis scrittura come abbia ancora di 256 ma minore di 65536 simboli, codesto significa come qualsivoglia inclinazione sara ratificato in coppia byte, da 00000000-00000000 per 11111111-11111111. Codifiche di attuale tipo si chiamano “wide-char” (scrittura larghi). Malgrado forse ed improvvisamente comprensibili, queste codifiche hanno excretion questione evidente, qualcuno latente anche qualcuno ad esempio interessa specialmente i programmatori.
Excretion esempio: UCS-2 (UTF-16)
Consideriamo, che campione tutt’altro come irreale, una regole U sia specie (questa codificazione e principalmente quella come, durante UNICODE, e convocazione UCS-2).
2) U utilizza i primi 256 codepoint nello uguale serenita e per lo identico significato del codepage latin-1. Corrente significa come tutte le studio letterario delle principali lingue europee occidentali sono contenute durante insecable celibe byte ragazze adolescenti Russo carine, il primo dei paio.
Il iniziale problema (quegli evidente) e l’inefficienza di U. U infatti contiene 511 simboli che vengono codificati durante sequenze quale hanno almeno indivis byte vano. Eppure, qualora U viene utilizzata per criptare testi costituiti da soli alfabeto occidentali, questi risultano vestire il infido dello posto (e vengono trasmessi nel ipocrita del tempo) che razza di sarebbe necessario, perche qualunque i elemento occidentali hanno una trascrizione luogo il byte ancora caratteristico e fallimentare.
Il conformemente concetto (quello meno dichiarazione) e gente come concetto dell’endianness. La parola endianness di nuovo la frasario associata derivano dai nomi di due fazioni politiche che razza di esistevano nelle favolose isole di Lilliput di nuovo Blefuscu (che tipo di racconta Swift ne i “Viaggi di Gulliver”) i cui membri si distinguevano verso l’estremita da cui iniziavano ad aprire le uova: quella evidente (a Lilliput, verso avviso del sovrano che tipo di una volta si periodo aperto aprendo insecable uovo dall’estremita oltre a istante: big endians) ovvero quella frugola (per Blefuscu, per opposizione riguardo a il regnante: little endians). Contro questa sottrazione (e sulla coula titolo regio), eta scoppiata tra le paio isole una contesa sanguinosa luogo bravi lillipuziani di nuovo blefuscudiani si scannavano sopra moltitudine. Mediante successione informatico, l’endianness ha detto origine per grattacapi eccetto sanguinosi, tuttavia ancora piu idioti di quelli provocati per Lilliput.