Мой профиль...

Поиск по этому блогу

четверг, 29 ноября 2007 г.

Про разделители («.» «?» «!» «,») в анкоре ссылки

Общее правило:

Из анкора Яндекс учитывает только первый пассаж.

При этом правила разбиения текстов на пассажи у Яндекса универсальные, и влияют они не только на учет анкоров, но и на находимость по многословным запросам с переколдовкой &.

Запятая считается разделителем наподобие пробела.

Пробел - это чисто разделитель между словами. Но со знаком препинания перед ним (разделяющим пассаж) - соответственно в комплексе дает два разных пассажа.

Элементы меню, к примеру, по логике построения контента можно считать отдельными предложениями, хотя они и не оканчиваются точкой. Но случается (из-за особенностей верстки), что они попадают в один пассаж.

Пока конструкция вида

слово1 & слово2

дает результат - значит, они находятся в одном пассаже.

То, что войдет в пассаж, зависит от того, какая будет переколдовка. Она часто бывает разная, и для запросов А Б тоже - варианты: от "подряд" до "в пределах документа".

Пассажи — непересекающиеся отрезки, на которые Яндекс разбивает документ (в том числе его анкор-лист) и которые характеризуются рядом важных свойств.

Важные свойства пассажа:
(i) по пассажам рассчитывается (текстовая) релевантность документа (см. «Яндекс на РОМИП»);
(ii) внутри пассажа определено междусловное расстояние (оператор &/(расстояние));
(iii) между пассажами в теле документа определено межпассажное расстояние (оператор &&/(расстояние));
(iv) два слова из одного пассажа могут быть найдены (?=подсвечены) по запросу «слово1 & слово2» (следствие из (ii));
(v) два слова из разных пассажей не могут быть найдены (?=подсвечены) по запросу «слово1 & слово2» (следствие из (ii));
(vi) только первый пассаж, входящий в текст ссылки, может попадать в анкор-лист акцептора. (с) Иванов

Список свойств можно расширять и дополнять. Свойства пассажа могут (с определенными оговорками) использоваться при анализе как признаки пассажа.

Разбиение на пассажи тайтла происходит точно так же, как и разбиение ссылки.
Стоп-символами в анкоре ссылки являются ".", "!", "?", ";", в том случае, если после них идет предложение ТОЛЬКО с большой буквы, в противном случае на пассажи не разобьет.

Ссылки в тему:
http://www.blogovo.ru/archives/12

Интересно мнение Михи Кузьмина: "что мы понимаем под пассажем, запросонезависимо. Разбивается от первого слова по разделителям пассажей. При индексации.

Затем, при использовании операторов типа &(x y), используеццо именно оно. При && и так понятно."

Комментариев нет:

Релевантные посты...

Related Posts with Thumbnails