ЛУЧШИЙ САЙТ ДЛЯ ВЕБ-РАЗРАБОТЧИКОВ

HTML Кодировки

HTML Наборы симолов HTML ASCII HTML WIN-1252 HTML ISO-8859 HTML символы HTML UTF-8

HTML UTF-8

Латинский базовый Латинский дополнительный Латинский расширенный A Латинский расширенный B Модифицированные буквы Диакритические метки Греческий и коптский Кириллица базовая Кириллица дополнительная

HTML Символы

Общая пунктуация Символы валют Буквенные символы Стрелки Математические операторы Блочные чертежи Блочные элементы Геометрические фигуры Разные символы Дингбаты Эмоджи Эмоджи смайлы Эмоджи скинтоны

HTML Объекты

HTML4 Объекты HTML5 Объекты A HTML5 Объекты B HTML5 Объекты C HTML5 Объекты D HTML5 Объекты E HTML5 Объекты F HTML5 Объекты G HTML5 Объекты H HTML5 Объекты I HTML5 Объекты J HTML5 Объекты K HTML5 Объекты L HTML5 Объекты M HTML5 Объекты N HTML5 Объекты O HTML5 Объекты P HTML5 Объекты Q HTML5 Объекты R HTML5 Объекты S HTML5 Объекты T HTML5 Объекты U HTML5 Объекты V HTML5 Объекты W HTML5 Объекты X HTML5 Объекты Y HTML5 Объекты Z

Наборы символов

HTML Наборы символов


Для правильного отображения HTML-страницы браузер должен знать, какой набор символов (кодировку) использовать:

Пример

<meta charset="UTF-8">

HTML Наборы символов

Для HTML5 кодировка символов по умолчанию - UTF-8.

Но так было не всегда. Кодировка символов для раннего веба была ASCII.

Позже, с HTML 2.0 до HTML 4.01, ISO-8859-1 считался стандартом.

С XML и HTML5 наконец-то появился UTF-8 и решил множество проблем кодировки символов.


В начале: ASCII

Компьютерные данные хранятся в виде двоичных кодов (01000101) в электронике.

Для стандартизации хранения текста был создан Американский стандартный код для обмена информацией (ASCII). Он определил уникальное двоичное число для каждого сохраняемого символа для поддержки чисел от 0 до 9, прописных и строчных букв (a-z, A-Z) и специальных символов, таких как ! $ + - ( ) @ < > , .

Поскольку ASCII использовал 7 бит для символа, он мог представлять только 128 различных символов.

Самым большим недостатком ASCII было то, что он исключал неанглийские буквы.

ASCII все ещё используется сегодня, особенно в крупных компьютерных системах.

Для более детального ознакомления, пожалуйста, изучите наш Полный справочник ASCII.


В Windows: Windows-1252

Windows-1252 был набором символов по умолчанию в Windows, вплоть до Windows 95.

Это расширение ASCII с добавлением международных символов.

Он использует полный байт (8 бит) для представления 256 различных символов.

Поскольку Windows-1252 по умолчанию используется в Windows, она поддерживается всеми браузерами.

Для более детального изучения, пожалуйста, изучите: Полный справочник Windows-1252.


В HTML 4: ISO-8859-1

Набор символов по умолчанию в HTML 4 - это ISO-8859-1.

ISO-8859-1 является расширением ASCII с добавлением международных символов.

Пример

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

В HTML 4 набор символов, отличный от ISO-8859-1, может быть указан в теге <meta>:

Пример

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Все процессоры HTML 4 также поддерживают UTF-8:

Пример

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Когда браузер обнаруживает ISO-8859-1, обычно по умолчанию используется Windows-1252, поскольку в Windows-1252 есть еще 32 международных символа.

Для более детального изучения, пожалуйста, изучите: Полный справочник ISO-8859-1


В HTML5: Unicode UTF-8

Набор символов по умолчанию для HTML5 - это UTF-8.

Пример

<meta charset="UTF-8">

Набор символов, отличный от UTF-8, может быть указан в теге <meta>:

Пример

<meta charset="ISO-8859-1">

Консорциум Unicode разработал стандарты UTF-8 и UTF-16, поскольку наборы символов ISO-8859 ограничены и несовместимы с многоязычной средой.

Стандарт Unicode охватывает (почти) все символы, знаки препинания и символы в мире.

Все процессоры HTML5 и XML поддерживают UTF-8, UTF-16, Windows-1252 и ISO-8859.

Для более детального изучения, пожалуйста, изучите: Полный справочник Unicode.