Параметры расчета поведенческих факторов в Яндекс

Ещё на CIKM2013 был озвучен доклад по принципам расчета поведенческих факторов в Яндекс. Тем не менее, понадобилось время, чтобы отделить зерна от плевел. Благодаря проведённой Евгением (aka devvver) работе, мы можем взглянуть на эти поведенческие факторы во вполне конструктивном русле и понять, что же из них рулит и в каком направлении нам двигаться.

Начну с того, что основной интерес здесь представляют три основных параметра, а именно:

  • QueryDomCTR – это среднее значение CTR всех документов домена по соответствующему запросу. Другими словами, это тематический траст группы веб-страниц, релевантных конкретному запросу.
  • QueryUrlCTR – это среднее значение CTR документа по соответствующему запросу. Другими словами, это CTR веб-страницы в выдаче Яндекс, который и пытаются накручивать большинство современных сервисов продвижения, вроде SERP Click, Userator и т.д. В тоже время, если учесть другие факторы ранжирования, становится понятно, что столь узкое воздействие, не может дать серьёзного результата.
  • AvSatSteps – это среднее количество удовлетворённых шагов по сайту. Говоря «удовлетворённых», подразумеваются переходы по внутренним ссылкам после 30 секунд пребывания на документе. Этот параметр позволяет определить более релевантные веб-страницы сайта, а также степень заинтересованности пользователя в опубликованной на них информации. Чем-то этот параметр похож на уровень отказов в той же метрике.

Остальные параметра построены по принципу, чем больше пользователь проведет времени на сайте, тем лучше. По сути, они нужны для корреляции данных, т.е. исключения попыток накрутки.

  • QDwellTimeDev – это стандартное отклонение (девиация) от среднего времени пребывания на документе по соответствующему запросу.
  • QDwellTime – это среднее время пребывания посетителя на документе по запросу.
  • AvDwellTime – это общее среднее время пребывания пользователя на документе по разным поисковым запросам.
  • DwellTimeDev – это стандартное отклонение (девиация) времени пребывания на сайте.
  • 90thDwellTime – это верхний дециль, он же 90-й перцентиль, среднего времени пребывания на сайте. Уточню, дециль – характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. В общем, если интересно почитайте тут.
  • 10thDwellTime – это нижний дециль среднего времени пребывания на сайте.
  • TimeOnDomain – это общее время пребывания на сайте. По всем запросам любых документов.
  • CumulativeDev – это стандартное отклонение (девиация) от среднего времени пребывания на сайте.

Честно говоря, с учётом выше изложенного, у меня возникает закономерное непонимание того, как Яндекс определяет ряд параметров, которые выходят за рамки поисковой выдачи. Очевидно, что для этого просто необходимы данные метрики. Об этом же говорили и говорят ряд SEO-специалистов, утверждая, что Яндекс использует данные Метрики для определения параметров, влияющих на ранжирование в поисковой выдаче. Конечно, они служат в большей степени для корреляции данных, но в том-то и проблема. В общем, мотайте на ус, а у меня всё. Спасибо за внимание. Удачи!