Крипто-форум crprogram.16mb.com

Програмування на Object Pascal, Lazarus, криптографія, криптоаналіз, шифри, вихідні коди, вирішення задач, приклади програм

Часовий пояс: UTC десь + 2 години




Розпочати нову тему Відповісти  [ 2 повідомлень ] 
Автор Повідомлення
 Заголовок повідомлення: UTF-8
СообщениеДодано: 09 гру 2014, 20:48 
Не в мережі

Повідомлень: 23
UTF-8 (Transformation Format з 8-біт, "Формат перетворення" - 8 біт) - система кодування, ка полягає у преставленні символів Юнікоду у 8-ми бітовому кодуванні.


Повернутися наверх
  
 
 Заголовок повідомлення: Re: UTF-8
СообщениеДодано: 09 гру 2014, 20:48 
Не в мережі

Повідомлень: 362
Символи таблиці ASCII від 0 до 127 кодуються одним байтом, який починається на 0:
Код:
0XXXXXXX


Всі інші символи кодуються декількома байтами, і виділяються старшим бітом рівним 1.

Кирилиця, арабський алфавіт, грецький, єврейський і деякі інші кодуються двома байтами:
Код:
110XXXXX   10XXXXXX


Китайські ієрогліфи, японські писемності(катакана, хірагана), корейське письмо, писемності мов Індії ( деванагарі, тамільське, телугу тощо) кодуються трьома байтами:
Код:
1110XXXX   10XXXXXX   10XXXXXX


де Х-бітові значення ( 0 або 1).

Послідовності ХХ...ХХХ відповідають кодуванню UNICODE.


Повернутися наверх
  
 
Показати повідомлення за:  Сортувати по:  
Розпочати нову тему Відповісти  [ 2 повідомлень ] 

Часовий пояс: UTC десь + 2 години



cron
Роwеrеd bу рhрВB® аnd Hostinger web hosting