Ce este o codificare caracter, windsc

Calculatoarele pot procesa informații numai în formă numerică. Prin urmare, în procesarea textelor în calculator, fiecare caracter al textului ar trebui să fie mapat la un anumit număr. Tabelul de corespondență între setul de caractere și cifre (numeric simbolurile de cod) se numește codificare caracter.







Codificare caractere este utilizat pentru introducerea textelor și a documentelor în computer și afișează mesajele text si documente umane poate fi citit (de exemplu, monitor, imprimantă, și așa mai departe. D.).

Notă. tabel de codificare este uneori numit de pagini de cod.

tipuri de codificări

În prezent, cele mai comune două tipuri de seturi de caractere:

  • Codurile pe un octet, care sunt utilizate într-un octet (8 biți), care codifică un simbol al textului;
  • Unicode (Unicode) - trebuie să codifice un caracter al textului folosit de două sau patru octeți.






codificări pe un singur octet au fost destul de acceptabil pentru majoritatea utilizatorilor - după 256 de coduri de caractere sunt suficiente pentru a codifica texte în majoritatea limbilor. Dar când computerele au devenit utilizate pe scară largă în întreaga lume, numărul de codificări pe un singur octet a fost în sute. La urma urmei, oamenii de limbă folosesc foarte mult, de multe ori, aceste limbi au propriul lor alfabet special (greacă, ebraică, și așa mai departe. D.), și, prin urmare, ei au nevoie de propriul lor de codificare. În plus, de multe ori o singură limbă au fost în uz de mai multe codificări. Toate acestea au fost provoca dificultăți și confuzie, în special atunci când crearea de documente multilingve și în relațiile internaționale. Deci, acum, în loc de mai multe codificări pe un octet sunt din ce în ce utilizează codarea versatil de Unicode.

codare Unicode. În ultimii ani, creșterea utilizării este Unicode (Unicode). De obicei, doi octeți utilizate pentru a codifica fiecare caracter, iar pentru unele caractere - 4 octeți (doi octeți nu a fost suficient).

În codurile Unicode sunt utilizate pentru aproape toate de caractere (litere ale alfabetului în diferite limbi, matematică, simboluri decorative și așa mai departe. D.). Este foarte convenabil, atât de multe programe noi pentru a codifica date text folosind Unicode.