|
Главная > Руководство разработчика > Настройка поиска по сайту > Настройки модуля поискаНастройки модуля поиска Прочие настройки модуля ("Поиск по сайту"-"Настройки"):
- Индексация страниц
- не индексировать страницы, для которых установлен флаг "непоисковая ссылка в меню" и не индексировать страницы, для которых не установлен флаг "включать страницу в карту сайта" - эти опции позволяют в некоторой степени контролировать список индексируемых страниц, то есть задавать, какие страницы не индексировать. Как правило, по логике построения сайта действительно достаточно совместить включение в список индексации с одним из двух названных флагов. По умолчанию обе опции выставлены в "Да".
Независимо от значения данных опций система не будет индексировать страницы, для которых на момент индексации снята видимость (флаг "страница доступна посетителям сайта")
- Индексация слов
- индексировать только слова длиной не менее - можно задать минимальную длину включаемых в индекс слов; слова, более короткие, чем заданное значение, будут игнорироваться и при индексации, и при поиске.
При любом значении этой настройки система будет игнорировать слова длиной менее 3-х символов.
- эти слова индексировать в любом случае - впишите сюда слова, которые короче, чем задано в предыдущей настройке, но которые тем не менее следует индексировать и искать.
Как правило, это может понадобиться для каких-то аббревиатур или названий моделей. Слова вводите, разделяя их пробелом, переносом строки, запятой или точкой с запятой. Например:
йод, ель, еда xml, rss; mx, xp; XXL ОБЖ, ЦРУ
- эти слова не индексировать в любом случае - список слов, проходящих по длине, но которые тем не менее индексировать не следует. Например:
были, будем, будут давно, потом; когда, если, зачем Вы можете проанализировать индекс сайта ("Поиск по сайту"-"Индексы") и занести оттуда лишние слова в этот список. Это несколько ускорит процесс поиска для посетителей сайта, но несколько замедлит сам процесс индексации.
- Релевантность
В процессе индексации сайта система назначает каждой странице некоторый 'вес' относительно каждого встречающегося на ней слова. Если при поиске по какому-либо слову будет найдено несколько страниц, они будут показаны посетителю в порядке уменьшения веса. Как система вычисляет вес страницы относительно искомого слова ? Простым подсчетом количества вхождения слова в текст данной страницы. При этом система применяет некоторые коэффициенты, зависящие от области, в которой встречается слово. Например, по умолчанию коэффициент заголовка выше, чем коэффициент простого текста. Поэтому, если две страницы содержат слово "кролик", но первая в заголовке, а вторая просто в тексте, то при индексации вес первой страницы относительно слова "кролик" будет больше, и при поиске по запрсу "кролик", она появится выше в выдаче результатов, чем вторая. Вы можете самостоятельно задавать эти коэффициенты для областей. Система при индексации различает следующие области страницы и соответственно позволяет задавать следующие настройки:
- 'вес' слова в названии страницы - для слов, найденных в содержимом поля название (name) страницы
- 'вес' слова в области "title" - для слов, найденных в содержимом мета-тега title
- 'вес' слова в области "keywords" - для слов, найденных в содержимом мета-тега keywords
- 'вес' слова в области "заголовок H1" - для слов, найденных в содержимом тега H1
- 'вес' слова в областях "заголовок H2, H3, H4" - для слов, найденных в содержимом тегов H2, H3, H4
- 'вес' слова в области "description" - для слов, найденных в содержимом мета-тега description
- 'вес' слова в "теле" страницы - для всех остальных слов
При этом система вовсе не индексирует текст javascript-скриптов, текст внутри тега noindex, а также текст элементов навигации, сформированных самой системой (меню, навигация по рубрике, путь до страницы и т.д.).
Прочие настройки, влияющие на релевантность:
- допустимый диапазон разброса искомых слов на странице - при многословном запросе все найденные страницы, в которых присутствуют все значимые слова запроса, будут разбиты на две группы. В первую группу войдут такие страницы, в которых есть область длиной не более N слов, содержащая все слова запроса. Во сторую - страницы, в которых такая область отсутствует, хотя и найдены все слова.
Значение N определяется системой как значение данной настройки плюс количество уникальных значимых слов в запросе.
- по умолчанию искать только страницы, содержащие все слова - как будет вестись поиск при подаче запроса из краткой формы и как будет по умолчанию выставлена соответствующая "галка" расширенной формы.
- по умолчанию искать только точные совпадения слов - как будет вестись поиск при подаче запроса из краткой формы и как будет по умолчанию выставлена соответствующая "галка" расширенной формы.
|
|