Используемые символы

А теперь обратимся к политике используемых символов в HTML. Как известно, в компьютерах каждый символ все-таки на самом деле является неким числом. И операционная система при дакэбражеши текста выводит уже символ, соответствующий какому-либо числу. Таблица соответствия чисел и символов называется кодировкой. Но дело в том, что кодировок только для русскоязычных символов уже не менее пяти. И если браузер не распознает, какая кодировка использована гфи создании Web-страницы, то вместо текста пользователь увидит мешанину непонятных символов. Каждый, наверное, с этим встречался. Поэтому в каждый браузер встроена функция смены кодировки отображаемой Web-страницы. Однако язык HTML обладает возможностями указания используемой кодировки, чтобы браузер не пытался распознать ее самостоятельно. Для этих целей используется уже знакомый нам тег <meta>. Дело в том, что среди предбпределенных переменных протокола HTTP есть переменная с наименованием Сontent-Type. Она задает тип содержимого Web-страницы и дополнительно позволяет указывать наименование применяемой кодировки. Полностью соответствующая конструкция выглядит так:

<МЕТА. http-equiv="Content-Type" content="text/html;
charset=ISO-8858-5">

В приведенном примере видно, что значение переменной состоит из двух частей, разделенных знаком точки с запятой. Первая часть говорит о том, что данный документ является обычным текстом с тегами HTML, а вторая часть указывает используемую кодировку. При этом использование слова charset является обязательным. А, после знака равенства указывается уже само название кодировки. В примере использовано стандартная кодировка, утвержденная Международной Организацией по Стандартизации (ISO) с поддержкой кириллицы. Однако вместо нее можно использовать стандартную кириллическую кодировку Windows или КОИ-8.
Также следует указать, что браузеры не могут обычным порядком отображать некоторые символы, которые встречаются в тексте. Так, если браузер в тексте встретит знак неравенства "меньше", то он просто интерпретирует его как открывающую скобку для тега. А так как стандартного тега за этим знаком не последует, то некоторая часть текста будет просто проигнорирована и не отображена. Более того, некоторые специализированные европейские символы просто отсутствуют на клавиатуре, и их будет затруднительно .вставить в текст содержимого Web-страницы. Проблему необходимо было решить. И выход был найден.
Вместо самих символов в текст подставлялись последовательности, которые можно было уже нормально интерпретировать. Так, знак неравенства "меньше", он же — открывающая угловая скобка, заменяется на последовательность &it;, В данном случае вся последовательность заключена в кавычки, начинается она со знака амперсанта, а заканчивается знаком точки с запятой. Подобные последовательности перекочевали и в язык следующего поколения — XML, и получили название "eatities", что в русскоязычной литературе переводят как "сущности". Перевод, конечно, правильный, но, к сожалению, ничуть не разъясняет суть дела. Проще и, наверное, правильней называть эти сущности текстовыми подстановками. Список текстовых подстановок используемых в HTML приведен в табл. 1.1.

Таблица 1.1. Текстовые подстановки

Символы
Описание
&lt;
Знак неравенства "меньше" (<)

&gt ;

Знак неравенства "больше" (>),
&amp;
Знак амперсанта (&)
&quot;
Знак кавычек
&Agrave
Прописная А, тупое ударение
&Aacute
Прописная А, сильное ударение
&Acirc
Прописная А, диакритическое ударение
&Atilde
Прописная А, тильда
&Auml
Прописная А, умляут
&Aring
Прописная А, звонко» произношение
&agrave
Строчная а, тупое ударение
&acute
Строчная а, сильное ударение
&acirc
Строчная а, диакритическое ударение
&atilde
Строчная а, тильда
&auml
Строчная а, умляут
&aring
Строчная а, звонкое произношение
&Aelig
Прописные АЕ, дифтонг
&aelig
Строчные ае, дифтонг
&Ccedil
Прописная С, седиль
&ccedil
Строчная с, седиль
&Egrave
Прописная Е, тупое ударение
&Eacute
Прописная Е, сильное ударение
&Ecirc
Прописная Е, диакритическое ударение
&Еuml
Прописная Е, умляут
&egrave
Строчная е, тупое ударение
&eacute
Строчная е, сильное ударение
&ecirc
Строчная е, диакритическое ударение
&euml
Строчная е, умляут
&Iacute
Прописная I, сильное ударение
&Igrave
Прописная I, тупое ударение
&Iuml
Прописная I, умляут
&iacute
Строчная i, сильное ударение
&igrave
Строчная i, тупое ударение
&ticirc
Строчная i, диакритическое ударение
&iuml
Строчная i, умляут
&ETH
Сочетание Eth
&eth
Строчные eth
&Ntilde
Прописная N, тильда
&ntilde
Строчная п, тильда
&Ograve
Прописная О, тупое ударение
&Oacute,
Прописная О, сильное ударение
&0circ .
Прописная О, диакритическое ударение
&0tilde
Прописная 0, тильда
&Ouml
Прописная О, умляут
&Oslash
Прописная О, слэш
&ograve
Строчная о, тупое ударение
&oacute
Строчная о, сильное ударение
&ocirc
Строчная о, диакритическое ударение
&otilde
Строчная о, тильда ,
&ouml
Строчная о, умляут
&oslash
Строчная о, слэш
&Ugrave
Прописная U, тупое ударение
&Uacute
Прописная U, сильное ударение
&Ucirc
Прописная U, диакритическое ударение
&Uuml
Прописная U, умляут
&ugrave
Строчная и, тупое ударение
&uacute
Строчная и, сильное ударение
&ucirc
Строчная и, диакритическое ударение
&uuml
Строчная и, умляут
&Yacute
Прописная Y, сильное ударение
&yacute
Строчная у, сильное ударение
&reg
Зарегистрированная торговая марка — Trademark
scopy
Права собственности - Copyright
Snbsp
Неразделяемый пробел

Но подстановки бывают не только текстовыми. Мы можем воспользоваться подстановкой для вставки в текст любогр символа из текущей кодировки, если нам известен его числовой код. Для этого используется конструкция "&#числовой_код;". В подобном формате численных подстановок используется запись числового кода в десятичном виде. Если необходимо использовать шестнадцатеричную запись, то подстановка примет следующий вид: "&#хчисловой_код;", т. е. после знака решетки добавляется латинский символ "икс".