Введение. Из истории вопроса
Сама идея оценки поведения пользователей поисковыми системами не нова. Однако успешное практическое применение данная технология получила совсем недавно за счет значительного увеличения количества инструментов для сбора, анализа и хранения информации.
Первопроходцем в данной области считается американская поисковая система Direct Hit. Еще в конце 90-х годов прошлого столетия она начала учитывать при ранжировании кликабельность HTML-документа (страницы сайта) в различных рейтингах и в выдаче других поисковых систем. Тем самым создавался своего рода каталог наиболее интересных с точки зрения пользователей веб-страниц по определенным запросам. Результатами выдачи Direct Hit пользовались и другие поисковые системы (Lycos, LookSmart и MSN Search, HotBot). Существенным ее недостатком было отсутствие нелинейной формулы ранжирования с большим количеством различных факторов поведения пользователей, а также инструментов для сбора статистики и мощностей для хранения всей необходимой информации. Поисковая система Direct Hit получила низкое признание среди пользователей и была поглощена Ask Jeeves в 2000-х годах.
Следующим довольно значимым этапом развития поведенческих факторов была презентация компанией Microsoft технологии BrowseRank.
BrowseRank — это технология, учитывающая переходы пользователей по ссылкам с одного HTML-документа на другой, а также длительность сессии после перехода (время нахождения на том или ином сайте).
Алгоритм BrowseRank был создан для замены классического PageRank. Это позволило исключить из ранжирования площадки, созданные только для продажи ссылок, и значительно увеличить влияние ссылок с действительно посещаемых ресурсов. Учет длительности нахождения на сайте дал возможность оценивать востребованность информации. Данные по продолжительности или количеству переходов, которые существенно отличались от средних показателей поисковой истории пользователя, не участвовали в ранжировании для исключения возможности накрутки. По сравнению с классическим PageRank данная технология позволила значительно улучшить качество выдачи и автоматически отсеивать большое количество сайтов, абсолютно неинтересных пользователям.
Эра поведенческих факторов, или «Делайте сайты для людей»
Развитие алгоритмов ранжирования привело к появлению новых критериев оценки качества сайта с точки зрения удовлетворенности пользователей тем или иным ресурсом. Сегодня определенная совокупность подобных параметров объединена в группу под названием поведенческие факторы.
Поведенческие факторы — это метрики, которые характеризуют поведение пользователей в поисковой. выдач. е и непосредственно на сайте.
Их главная задача — улучшение качества построения поисковой выдачи. Для этого проводится анализ действий пользователей, в т. ч. с учетом их поисковой истории. Поисковая история пользователя — это собранные за длительный период (в среднем от 18 месяцев и более) данные о его поведении в поисковой системе и на сайтах, включающие в себя такие показатели, как:
- поисковые запросы и их последовательность;
- длительность нахождения на HTML-документе (странице сайта);
- внутренние переходы (в частности, количество успешных шагов, см. далее);
- показатель отказов;
- добавление в закладки и пр.
Персональная выдача — На основании данных о поисковой истории пользователя также происходит построение индивидуальной поисковой выдачи (впервые реализовано на платформе «Калининград») с учетом короткой и длинной персонализации. Персонализация подразумевает учет известных о пользователе данных при составлении выдачи по его запросу. Короткая персонализация включает текущие потребности и задачи (выбор товара, поиск конкретных услуг, отзывов и пр.), а длинная учитывает устоявшиеся базовые ценности и характеристики пользователя (родной язык, социальный статус, профессиональная деятельность, семейное положение, регион проживания и пр.).
Поисковая система Яндекс впервые начала использовать поведенческие факторы для ранжирования сайтов в конце 2009 — начале 2010 года. Этому способствовал переход на качественно новый уровень поисковой выдачи за счет внедрения машинного обучения алгоритма ранжирования на выборке сайтов, оцененных асессорами (технология MatrixNet).
Асессорская оценка. — это определение сотрудниками Яндекса релевантности документа, актуальности информации, предоставленной на странице, наличия элементов поискового спама, а также ряда других характеристик на основании специально разработанной инструкции. Данные используются для машинного обучения определения качества сайтов.
На первоначальном этапе влияние поведенческих факторов было минимальным. Они использовались лишь для изучения качества построения поисковой выдачи. Успешное тестирование внедрения ПФ привело к тому, что в 2011 году они стали оказывать значительное влияние на ранжирование сайтов.
В этих условиях накрутка поведенческих факторов позволяла любому ресурсу в течение нескольких недель выйти в ТОП по самым конкурентным запросам. В результате 15 июня 2011 года большое количество сайтов попало под фильтр поисковой системы Яндекс за накрутку поведенческих факторов. Он накладывался на весь ресурс и снижал трафик с поисковика практически до нуля. Вывод сайта из-под поведенческих санкций занимает от полугода до нескольких лет.
Характерный признак данного вида санкций — ранжирование сайта по всем СЧ и ВЧ запросам на позициях в районе 300-й и ниже, а также отсутствие улучшений по ним при корректировке текстовой и функциональной составляющей HTML-документа.
С каждым годом Яндекс придает все большую значимость поведенческим факторам для более качественного построения выдачи и совершенствует формулу выявления возможных накруток. Подобная смена приоритетов в полной мере отвечает основному лозунгу поисковой системы: «Делайте сайты для людей». Это позволило Яндексу в 2014 году значительно снизить роль ссылочной составляющей в ранжировании ресурсов части коммерческих тематик.
Мнение эксперта
Сергеи Никоноров. руководитель отдела поискового продвижения
Данная смена алгоритма не подразумевает полного отказа от ссылок. Она лишь придает больший вес другим факторам, многие из которых в той или иной степени связаны с теми же ссылками (количество переходов, длительность нахождения на документе после перехода и так далее). Постоянно улучшается лингвистический анализ контента поисковой системой, предпочтение отдается сайтам с более развитым функционалом, увеличивается влияние качества ссылочных площадок, коммерческой составляющей ресурса и, как следствие, поведенческих факторов.
Речь идет о Яндексе. Здесь и далее мы говорим о ПФ на примере поисковой системы Яндекс, поскольку в ней используются наиболее совершенные алгоритмы сбора и анализа информации на основе поведения пользователей.
Откуда берутся ПФ?
Сбор данных о поведении пользователей происходит непрерывно через множество каналов, в числе которых:
- Системы статистики:
- Google Analytics;
- Яндекс. Метрика;
- Livelnternet.
- Браузеры:
- Google Chrome;
- Яндекс. Браузер;
- Mozilla Firefox.
- Элементы Яндекса (ранее — Яндекс. Бар).
- Приложения для браузеров, мобильные приложения и прочее программное обеспечение компаний, подписавших соглашение с Яндексом об обмене данными.
Миф
Установка счетчиков, таких как Google Analytics, Яндекс. Метрика, или же, наоборот, принципиальный отказ от них не оказывает существенного влияния на качество оценки ПФ и, как следствие, на ранжирование сайта.
Всю необходимую информацию поисковые системы могут получить посредством браузеров или программного обеспечения, установленного на компьютере. Каждый из указанных выше источников лишь дополняет данные, полученные по другим каналам. Таким образом, поисковая система в любом случае получит все нужные ей параметры, возможно, по меньшей выборке, но, тем не менее, в количестве, достаточном для составления наглядной картины.
Зачем нужны ПФ
Поведенческие факторы нужны для получения поисковой системой опосредованной независимой оценки пользователями как сайтов, представленных в результатах выдачи, так и самой выдачи.
Поведенческие факторы позволяют сформировать оптимальное соотношение различных типов ресурсов, представленных в выдаче по неявным и многозначным запросам (с учетом влияния истории пользователей).
Неявные запросы — это запросы пользователей, содержащие большое количество вероятных векторов дальнейшего поведения и требующие уточнения. Например, к этому типу относятся практически все однословные запросы: ноутбук, смартфон, телевизор и так далее.
Многозначные запросы — это запросы пользователей, которые могут интерпретироваться по-разному (чаще всего это о_мо_нимы1 или слова, имеющие несколько значений), например, замок, калина, духи и так далее.
Также поведенческие факторы помогают системе практически мгновенно реагировать на изменение интересов большого количества групп пользователей.
Пример резкого изменения интересов пользователей
В стандартных условиях при вводе запроса в виде фамилии человека выдача формируется в основном из биографии, ссылок на «Википедию», Яндекс. Картинок, профилей в социальных сетях. Когда происходят какие-либо неординарные события или появляется большое количество новостей о данном человеке, пользователи после ввода поискового запроса в виде фамилии добавляют второй уточняющий запрос. Когда процент пользователей, вводящих уточнение, значительно увеличивается, происходит изменение поисковой выдачи с учетом этих уточняющих слов, появляется большое число новостных сайтов с данной информацией.
Пример плавного изменения интересов пользователей
Во время кризиса товары низкого ценового диапазона пользуются большей популярностью, чем сегмент премиум. На основании этих данных поисковая система отдает до 9 позиций в ТОП 10 сайтам, содержащим более доступные товары. После окончания кризиса и увеличения покупательской способности населения поисковая выдача начинает плавно изменяться, включая сначала сайты среднего сегмента, а потом и категории премиум.
Все это важно учитывать при составлении пула запросов, по которым пользователи будут переходить на ваш сайт (тем самым, безусловно, оценивая его качество, т. к. их реакция будет зафиксирована поисковой системой в виде ряда поведенческих метрик). Потребность в корректировке запросов может быть обусловлена достаточно длительными процессами (при плавном изменении поисковой выдачи), которые, разумеется, надо отслеживать. Что касается резкой смены предпочтений пользователей, здесь следует рассматривать возможность тем или иным образом попасть в выдачу по уточненному запросу (так, в нашем примере, если формат ресурса позволяет, можно разместить новость о Михаиле Пореченкове). При этом корректировка пула запросов может и не потребоваться, т. к. смена настроений носит «взрывной» характер и чаще всего спустя какое-то время перестает влиять на выдачу.
Отдельных аспектов того, как ПФ влияют на вынесение вердикта о качестве сайта, мы коснемся в последующих главах. Пока же обратим внимание на другую сторону вопроса. Поскольку ПФ являются достаточно косвенной, опосредованной оценкой пользователями того или иного ресурса, работа над их улучшением должна носить комплексный характер. Важно стремиться к достижению соответствия неким основополагающим нормам, традиционным ценностям, к интуитивно понятным решениям, которые позволят пользователю ненавязчиво и в полной мере удовлетворить свои потребности.
Мнение эксперта
Михаил Ахромушкин. ведущий специалист трафиковых проектов
Работа над сайтом с точки зрения улучшения поведенческих факторов для попадания в ТОП 3-5 по ВЧ и СЧ запросам подразумевает комплексную работу над содержанием ресурса, функциональными элементами (см. далее.), отображением в выдаче поисковых систем. Работа над одним из кластеров факторов не приведет к должному результату.