Используемые символы

А теперь обратимся к политике используемых символов в HTML. Как известно, в компьютерах каждый символ все-таки на самом деле является неким числом. И операционная система при дакэбражеши текста выводит уже символ, соответствующий какому-либо числу. Таблица соответствия чисел и символов называется кодировкой. Но дело в том, что кодировок только для русскоязычных символов уже не менее пяти. И если браузер не распознает, какая кодировка использована гфи создании Web-страницы, то вместо текста пользователь увидит мешанину непонятных символов. Каждый, наверное, с этим встречался. Поэтому в каждый браузер встроена функция смены кодировки отображаемой Web-страницы. Однако язык HTML обладает возможностями указания используемой кодировки, чтобы браузер не пытался распознать ее самостоятельно. Для этих целей используется уже знакомый нам тег <meta>. Дело в том, что среди предбпределенных переменных протокола HTTP есть переменная с наименованием Сontent-Type. Она задает тип содержимого Web-страницы и дополнительно позволяет указывать наименование применяемой кодировки. Полностью соответствующая конструкция выглядит так:

<МЕТА. http-equiv="Content-Type" content="text/html;
charset=ISO-8858-5">

В приведенном примере видно, что значение переменной состоит из двух частей, разделенных знаком точки с запятой. Первая часть говорит о том, что данный документ является обычным текстом с тегами HTML, а вторая часть указывает используемую кодировку. При этом использование слова charset является обязательным. А, после знака равенства указывается уже само название кодировки. В примере использовано стандартная кодировка, утвержденная Международной Организацией по Стандартизации (ISO) с поддержкой кириллицы. Однако вместо нее можно использовать стандартную кириллическую кодировку Windows или КОИ-8.
Также следует указать, что браузеры не могут обычным порядком отображать некоторые символы, которые встречаются в тексте. Так, если браузер в тексте встретит знак неравенства "меньше", то он просто интерпретирует его как открывающую скобку для тега. А так как стандартного тега за этим знаком не последует, то некоторая часть текста будет просто проигнорирована и не отображена. Более того, некоторые специализированные европейские символы просто отсутствуют на клавиатуре, и их будет затруднительно .вставить в текст содержимого Web-страницы. Проблему необходимо было решить. И выход был найден.
Вместо самих символов в текст подставлялись последовательности, которые можно было уже нормально интерпретировать. Так, знак неравенства "меньше", он же — открывающая угловая скобка, заменяется на последовательность ⁢, В данном случае вся последовательность заключена в кавычки, начинается она со знака амперсанта, а заканчивается знаком точки с запятой. Подобные последовательности перекочевали и в язык следующего поколения — XML, и получили название "eatities", что в русскоязычной литературе переводят как "сущности". Перевод, конечно, правильный, но, к сожалению, ничуть не разъясняет суть дела. Проще и, наверное, правильней называть эти сущности текстовыми подстановками. Список текстовых подстановок используемых в HTML приведен в табл. 1.1.

Таблица 1.1. Текстовые подстановки

Символы	Описание
<	Знак неравенства "меньше" (<)
&gt ;	Знак неравенства "больше" (>),
&	Знак амперсанта (&)
"	Знак кавычек
&Agrave	Прописная А, тупое ударение
&Aacute	Прописная А, сильное ударение
&Acirc	Прописная А, диакритическое ударение
&Atilde	Прописная А, тильда
&Auml	Прописная А, умляут
&Aring	Прописная А, звонко» произношение
&agrave	Строчная а, тупое ударение
&acute	Строчная а, сильное ударение
&acirc	Строчная а, диакритическое ударение
&atilde	Строчная а, тильда
&auml	Строчная а, умляут
&aring	Строчная а, звонкое произношение
&Aelig	Прописные АЕ, дифтонг
&aelig	Строчные ае, дифтонг
&Ccedil	Прописная С, седиль
&ccedil	Строчная с, седиль
&Egrave	Прописная Е, тупое ударение
&Eacute	Прописная Е, сильное ударение
&Ecirc	Прописная Е, диакритическое ударение
&Еuml	Прописная Е, умляут
&egrave	Строчная е, тупое ударение
&eacute	Строчная е, сильное ударение
&ecirc	Строчная е, диакритическое ударение
&euml	Строчная е, умляут
&Iacute	Прописная I, сильное ударение
&Igrave	Прописная I, тупое ударение
&Iuml	Прописная I, умляут
&iacute	Строчная i, сильное ударение
&igrave	Строчная i, тупое ударение
&ticirc	Строчная i, диакритическое ударение
&iuml	Строчная i, умляут
&ETH	Сочетание Eth
&eth	Строчные eth
&Ntilde	Прописная N, тильда
&ntilde	Строчная п, тильда
&Ograve	Прописная О, тупое ударение
&Oacute,	Прописная О, сильное ударение
&0circ .	Прописная О, диакритическое ударение
&0tilde	Прописная 0, тильда
&Ouml	Прописная О, умляут
&Oslash	Прописная О, слэш
&ograve	Строчная о, тупое ударение
&oacute	Строчная о, сильное ударение
&ocirc	Строчная о, диакритическое ударение
&otilde	Строчная о, тильда ,
&ouml	Строчная о, умляут
&oslash	Строчная о, слэш
&Ugrave	Прописная U, тупое ударение
&Uacute	Прописная U, сильное ударение
&Ucirc	Прописная U, диакритическое ударение
&Uuml	Прописная U, умляут
&ugrave	Строчная и, тупое ударение
&uacute	Строчная и, сильное ударение
&ucirc	Строчная и, диакритическое ударение
&uuml	Строчная и, умляут
&Yacute	Прописная Y, сильное ударение
&yacute	Строчная у, сильное ударение
&reg	Зарегистрированная торговая марка — Trademark
scopy	Права собственности - Copyright
Snbsp	Неразделяемый пробел

Но подстановки бывают не только текстовыми. Мы можем воспользоваться подстановкой для вставки в текст любогр символа из текущей кодировки, если нам известен его числовой код. Для этого используется конструкция "&#числовой_код;". В подобном формате численных подстановок используется запись числового кода в десятичном виде. Если необходимо использовать шестнадцатеричную запись, то подстановка примет следующий вид: "&#хчисловой_код;", т. е. после знака решетки добавляется латинский символ "икс".