Набор символов Unicode


Набор символов Windows, чтобы представить каждый знак, использует 8 битов; поэтому, максимальное число символов, которое может быть выражено, при помощи использования 8 битов - 256 (2^8). Это обычно достаточно для западных языков, включая диакритические знаки, используемые французским, немецким, испанским и другими языками. Однако восточные языки используют тысячи отдельных символов, которые не могут быть закодированы при помощи использования однобайтовой схемы кодирования. С быстрым увеличением компьютерной торговли, двухбайтовые схемы кодирования были разработаны так, чтобы символы могли быть представлены 8-, 16-, 24- или 32 битовыми последовательностями. Это требует сложных передающих алгоритмов; даже в этом случае, когда используются разные кодовые наборы, можно получить полностью различные результаты на двух разных компьютерах.

Чтобы как-то решить проблему многочисленных схем кодирования, был разработан стандарт для представления данных - Unicode. 16 битная схема кодирования символов - Unicode может представлять 65,536 (2^16) знаков, которых достаточно для того, чтобы включить сегодня все языки в компьютерную торговлю, а также знаки препинания, математические символы и участок памяти для будущего расширения их состава. Система Unicode устанавливает уникальный код для каждого символа, гарантируя этим, что символьная трансляция будет всегда точной.

Назад в оглавление темы
На главную страницу темы

Hosted by uCoz