Codificare caractere - l

Set de caractere (set de caractere în limba engleză.) - tabel definit set finit de codificare de caractere. Acest tabel compară fiecare lungime de secvență de caractere într-unul sau mai mulți octeți.







De multe ori, de asemenea, în loc de „set de caractere“, termenul utiliza incorect termenul „pagina de cod“, ceea ce înseamnă, de fapt, un caz special al unui singur octet de codificare set de caractere.

În prezent, utilizate în principal trei tipuri de criptare: Compatibil cu EBCDIC și Unicode bazate pe 16 biți, cu predominanța covârșitoare a primului. Prezentarea Unicode este compatibil cu ASCII. Codificare pe bază DKOI-8) sunt folosite pe unele mainframe. Inițial un set de simboluri folosite de fiecare sistem de operare. seturi de caractere folosite acum [5]. depind de tipul de sistem de operare numai prin tradiție și sunt stabilite în funcție de localizare.

Wikipedia și alte proiecte ale Fundației Wikimedia folosind Unicode UTF-8.

Recunoașterea automată a codificări

Utilizarea mai multor seturi de caractere în software-ul de astăzi creează o mulțime de neplăceri, nu numai programatori. dar, de asemenea, utilizatorilor. Conform unui punct de vedere, Hopa, gunoi poate face față, în cazul în care programul va detecta automat codificarea textului de intrare.

Pentru codificări pe un singur octet poate fi dat de faptul că frecvența utilizării diferitelor litere sunt foarte diferite (de exemplu, în română adesea folosit „la“, dar rareori „b“). Prin urmare, cunoașterea limbii textului, puteți alege cu ușurință codificarea caracterelor în care frecvența de bytes corespunde mai bine frecvența de scrisori ale limbii.

O viziune alternativă consideră astfel de algoritmi euristici pentru a determina codificarea de text dăunătoare, deoarece tehnologiile informaționale moderne au mijloacele de a compara textul dispozițiilor în mod expres să-l pagina de cod (a se vedea. De exemplu, crearea de programe de date de text care încalcă standardele.

Codificare comună

  • ISO 646
    • EBCDIC
    • ISO 8859.
      • ISO 8859-1. ISO 8859-2. ISO 8859-3. ISO 8859-4. ISO 8859-5. ISO 8859-6, ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, ISO 8859-11, ISO 8859-13, ISO 8859-14, ISO 8859-15
      • CP850, CP852, CP866, CP869






    • Codificarea Microsoft Windows.
      • Windows 1252 pentru limbile occidentale
      • Windows 1254 pentru limba turcă
      • Windows 1255 pentru Ebraică
      • Windows 1256 pentru arabă
      • Windows 1257 pentru limbile baltice
      • Windows 1258 pentru Vietnameză
    • MacRoman, KOI8 (KOI8-R, KOI8-U ...), koi7
    • Codificare bulgară
    • ISCII
    • VISCII
    • Big5 (cea mai faimoasa versiune de Microsoft CP950)
      • GB2312
      • GBK (Microsoft CP936)
      • GB18030
    • Shift JIS pentru japoneză (Microsoft CP932)
    • EUC-KR pentru Coreeană (Microsoft CP949)
    • ISO-2022 și EUC pentru scris chineză
    • set de caractere Unicode UTF-16 codificat

    notițe

    Vezi ce „Codificare caractere“ în alte dicționare:

    Codificarea limbii române în programele de calculator și Internet - - toate caracterele care pot fi afișate pe un ecran de computer sunt descrise în tabela de simboluri. În primul tabel de caractere nu a fost literele românești. Pentru a lucra cu litere românești au trebuit să intre în acest set de caractere în loc de inutile ... ... Collegiate dicționar mass-media

    Codificare - Set de caractere (set de caractere în limba engleză.) Tabelul anumit set finit de codare a caracterelor. Acest tabel compară fiecare lungime de secvență de caractere într-unul sau mai mulți octeți. Deși termenul "setul de caractere" (eng. Set de caractere, ... ... Wikipedia

    Codificare alternativă - Verificați informațiile. Este necesar să se verifice exactitatea faptelor și exactitatea informațiilor conținute în acest articol. Pe pagina de discuție trebuie să fie o explicație. "Codare alternative", sub ... Wikipedia

    Set de caractere - tabel care specifică codificarea unui set finit de caractere ale alfabetului (de obicei elemente de text: litere, cifre, semne de punctuație) (setul de caractere engleză.). Acest tabel compară fiecare lungime de secvență de caractere într-una sau mai multe ... ... Wikipedia

    Șase biți care codifică - codificarea de șase biți utilizate în computere, fabricate în SUA în anii 1950 1960. Prin urmare, dimensiunea mașinii cuvântul acestor calculatoare un multiplu de 6 biți (de exemplu, 12, 18, 24, 36, 48, 60 de biți). Această dimensiune simbol permis ... ... Wikipedia

    Codificarea de bază - în conformitate cu GOST 19768 87 a fost adoptată în 1987 pentru a înlocui KOI 8, dar puțin utilizate. codificare de bază acceptă numai hardware și software, care este produsă în Uniunea Sovietică (PC UE, Lexicon, ...), precum și unele imprimante Epson ... Wikipedia

    UTF-8 - (. Din formatul de transformare engleză Unicode, 8 biți «Unicode Transformation Format, 8 biți") codificare comună de caractere Unicode, care este compatibil cu formatul de text de transmisie de 8-biți. A fost folosit pe scară largă în exploatare ... ... Wikipedia

    • codificare alternativă. Dzhessi Rassel. Această carte va fi făcută în conformitate cu comanda pe tehnologia de imprimare Tehnologie-on-Demand. Conținutul de calitate înaltă prin articole wikipedia! „? Alternative Vnaya codifică Application“ - bazat pe CP437 ... Citește mai mult Cumpărați 998 ruble