5.12.3. Индексация в поисковых системах. Подготовка страниц к индексации
Под индексацией страниц сайта в поисковой системе понимается обработка содержимого этих страниц поисковым роботом системы и внесение результатов такой обработки в базу данных поисковой системы.
Под успешной индексацией понимается такая индексация, при которой на необходимые владельцу сайта ключевые слова, вводимые пользователем, выдаются результаты, содержащие запись о данном сайте одной из первых (как минимум, на первой странице результатов поиска). При этом необходимо, чтобы информация, выводимая поисковой системой в качестве описания сайта, адекватно отражала содержание сайта и была привлекательной для посетителя.
В отличие от регистрации в каталогах и рейтингах, успешная индексация страниц сайта в поисковых системах может принести ощутимое количество посетителей даже небольшому сайту, не обладающему ни известностью, ни популярностью. Как уже отмечалось в гл. 2, поисковые системы представляют результаты обработки запроса в виде последовательного списка сайтов в порядке убывания релевантности (соответствия информационного наполнения сайта введенным пользователем ключевым словам или фразам).
Подготовка страниц к индексации поисковыми системами заключается в адаптации их содержания ко "вкусам" поисковой машины. Разные поисковые системы различным образом определяют релевантность страниц. Тем не менее, существуют общие критерии, используемые большинством поисковых систем. Вот некоторые из них:
количество ключевых слов. Это самый очевидный критерий. Чем больше ключевых слов на странице, тем выше ее релевантность. Естественно, находятся владельцы сайтов, которые пытаются любыми средствами добиться увеличения релевантности и размещают на странице весьма значительное количество ключевых слов, пряча их с помощью использования мелкого шрифта или цвета шрифта, совпадающего с цветом фона. Такие действия называются спамом поисковых машин. Администрация любой поисковой системы крайне отрицательно относится к спаму, и содержащие его страницы исключаются из базы данных;
расположение ключевых слов на странице. Этот критерий влияет на "вес" ключевых слов при определении релевантности. Наиболее значимыми являются слова, содержащиеся в заголовке страницы (HTML-тэг <TITLE>), выделенные в тексте полужирным шрифтом или увеличенным размером шрифта. Чем ближе слово расположено к началу страницы, тем больше его "вес". Большинство поисковых систем учитывает слова, содержащиеся в специальных служебных полях (мета-тегах), которые не отображаются на экране компьютера пользователя, но присутствуют в HTML-коде, формирующем страницу;
отношение количества ключевых слов к общему количеству слов на странице. Чем выше концентрация ключевых слов в тексте, расположенном на странице, тем более релевантной считают ее поисковые системы.
Исходя из вышеперечисленных критериев, используемых поисковыми системами, можно сформулировать основные рекомендации по подготовке страниц и индексации:
прежде всего, необходимо попытаться поставить себя на место пользователя и представить себе, какие ключевые слова будет использовать потребитель, относящийся к целевой группе, для построения запроса к поисковой системе. Правильный выбор ключевых слов является определяющим. Без него все остальные усилия могут оказаться бесполезными;
нужно обязательно внести самые важные ключевые слова в заголовок страницы. При этом заголовок нельзя делать слишком громоздким и неудобочитаемым, поскольку он будет отображаться в результатах поиска по ключевым словам;
по возможности, важные ключевые слова в тексте нужно выделить полужирным шрифтом или размером шрифта. При этом самые актуальные из них необходимо расположить ближе к началу страницы. Очевидно, что эти требования не всегда можно выполнить, не превращая текст в полную бессмыслицу. В данном случае необходимо прийти к разумному компромиссу;
в связи с тем, что эффективность подготовки страниц можно оценить только в сравнении с другими страницами, необходимо изучить страницы-конкуренты, ссылки на которые стоят одними из первых в результатах запросов, построенных с применением актуальных для сайта ключевых слов. Нужно внимательно просмотреть их (и в браузере, и в виде HTML-кода) и определить, где и в каком количестве находятся искомые ключевые слова. Поскольку основной задачей является попасть в первые ряды в результатах запросов, необходимо сделать свои страницы, по крайней мере, не хуже страниц-конкурентов, причем не по одному, а по всем наиболее важным ключевым словам;
для успешной индексации нужно обязательно использовать служебные поля (мета-тэги). Некоторые из них специально созданы для поисковых систем. Наиболее важных для нас свойств у мета-тэгов два: keyword и description. Свойство keyword предназначено для сообщения поисковой системе набора слов, являющихся ключевыми для сайта. Словам, содержащимся в нем, поисковые системы придают большое значение. Свойство description предназначено для размещения описания сайта, которое поисковая система разместит в результатах поиска под его заголовком. Слова, содержащиеся в описании, обычно учитываются поисковой системой. Ниже приведен фрагмент HTML-кода, содержащий свойства keyword и description:
<HEAD>
<ТIТLЕ>Интернет-магазин N</TITLE>
<МЕТА name="description" content="B нашем магазине представлен широкий выбор...">
<МЕТА name="keywords" content="книги, игры, видео, аудио...">
</HEAD>
в некоторых случаях структурная организация сайта строится с помощью фреймов (разбивки страниц на отдельные окна) и карт изображений (изображений, отдельные части которых оснащены гиперссылками на различные страницы сайта). Не все поисковые машины способны проиндексировать такие сайты. Для того чтобы помочь роботу поисковой машины правильно проиндексировать страницы, необходимо использовать специальные приемы. В случае применения фреймов (тэги <FRAME> И <FRAMESET>) необходимо добавить в HTML-код страницы описание сайта (с высокой концентрацией ключевых слов и ссылками на внутренние страницы сайта) внутри парного тэга <NOFRAMESX/NOFRAMES>. При использовании карт изображений (тэг <МАР>) необходимо предусмотреть на сайте альтернативную систему навигации (текстовые ссылки). В этом случае робот поисковой системы сможет свободно переходить со страницы на страницу и правильно их проиндексирует.
Подготовив страницы к индексации, можно просто подождать, когда роботы поисковых машин посетят эти страницы и проиндексируют их. Однако довольно часто это занимает весьма значительное время (более месяца). Поэтому подготовленные страницы можно зарегистрировать самостоятельно.
В Интернете есть много специальных систем регистрации, предлагающих бесплатно зарегистрировать страницы сайта в большом количестве поисковых систем. Вот некоторые примеры:
регистратура (www.registratura.ru). Сервис предлагает бесплатную регистрацию в ведущих российских и зарубежных поисковых системах и каталогах в полуавтоматическом режиме. Помимо бесплатной регистрации посетителям предлагаются платные услуги по профессиональной регистрации их сайтов с гарантией положительного результата;
TAU (www.design.ru/free/addurl). Система, разработанная студией Артемия Лебедева. Позволяет зарегистрировать страницы в десяти наиболее известных российских и зарубежных поисковых системах. По желанию пользователя возможно получение ответов от серверов поисковых систем о результатах регистрации;
система студии "JS-дизайн" (www.js.ru/poisk/submit.htm). Система позволяет в автоматическом режиме добавить ссылки на страницы сайта в девять основных поисковых систем (кроме Rambler);
Submit It! (www.submit-it.com). Один из платных сервисов портала bCentral. Стоимость услуг по добавлению страниц в поисковые системы с гарантированным результатом составляет от 49 долларов;
Add Me! (www.addme.com/submission.htm). Бесплатный сервис по добавлению страниц в двадцать наиболее популярных зарубежных поисковых систем.
По мнению специалистов не следует полностью доверять автоматическим регистраторам. В наиболее значимых поисковых системах и каталогах лучше регистрировать страницы самостоятельно и тщательно проверять результаты.
Не обязательно регистрировать все страницы сайта, особенно если на них ведут ссылки с зарегистрированных страниц. Роботы поисковых систем найдут такие страницы самостоятельно. Тем не менее, для сокращения времени индексации наиболее важных страниц сайта стоит зарегистрировать их вручную. Особенно важно зарегистрировать те страницы, которые открываются во фреймах или используют в качестве средств навигации карты изображений.
Для оценки результатов индексации страниц сайта необходимо через некоторое время (от одного дня до нескольких недель) посетить все наиболее важные поисковые системы и проверить, как страницы сайта отображаются в результатах запросов по актуальным для компании ключевым словам. Если результаты неудовлетворительны, необходимо провести подготовку страниц заново.