Релевантность и ранжирование — что это такое и какие факторы влияют на...

Релевантность и ранжирование — что это такое и какие факторы влияют на положение сайтов в выдаче Яндекса и Гугла

Сегодня я хочу поговорить о таких банальных для многих вебмастеров и оптимизаторов понятиях, как ранжирование и релевантность (это те термины, которые будут присутствовать в большинстве публикаций на тему SEO). Хотя для начинающих вебмастеров они не сразу становятся понятными и очевидными.

Конечно же, ничего сложного в этих терминах нет и главную проблему они представляют именно для поисковых систем. Им кровь из носа нужно максимально точно выстраивать иерархию сайтов и найти идеальные способы определения соответствия документа (веб страницы) запросу пользователя.

Релевантность и ранжирование — что это такое

Но это проблемы интернет-поисковиков, а наша с вами задача — немного помешать им в объективной оценке своего собственного ресурса (искусственно завысить релевантность по нужным нам поисковым запросам) и тем самым вылезти как можно выше при ранжировании в выдаче Яндекса и Гугла (вот именно для отсекания таких сильно зарвавшихся умников они и ввели понятие поведенческих факторов, которые позволяют выявить явно выраженную переоптимизацию и понизить спаммеров в выдаче).

Не совсем понятно о чем идет речь, тогда прочитайте несколько следующих абзацев, а вообще сегодня я хочу поговорить не о способах повышения соответствия веб страниц поисковым запросам (писал об этом очень много), а о том, как при стремлении быть хитрее и умнее поисковиков не навредить своему веб проекту, понизив его в выдаче (пессимизация, фильтры и страшное слово «бан»).

Итак, что же такое релевантность? В общем смысле — это степень соответствия чего-то чему-то, а применительно к поисковым системам — это соответствие запроса пользователя и веб страницы (документа), найденного этой поисковой системой в интернете (WWW) в качестве одного из ответов. Чем выше будет соответствие запроса содержанию страницы вашего ресурса, тем выше он будет стоять в поисковой выдаче (лучше будет ранжироваться).

Отсюда, кстати, можно сделать заключение, что SEO оптимизация — это ничто иное, как искусственное повышение релевантности страницы вашего сайта (веб документа) определенному запросу (или нескольким).

Т.е. подбираем предварительно часто задаваемые в Яндексе или Гугле вопросы и делаем так, чтобы определенные страницы нашего ресурса стали бы более релевантными, чем страницы других ресурсов, которые находятся на первым местах поисковой выдачи по этим же поисковым запросам:

Факторов, которые учитывают поисковые системы при этом, очень много (счет идет на сотни или даже тысячи), но не все из них представляют серьезную значимость и не на все из них мы может повлиять (или даже узнать об их существовании). Всю совокупность этих факторов, влияющих на выдачу, обычно условно делят на несколько групп:

  • Внутренние — контент веб страницы, ее структура и правильность верстки, а так же степень ее засспамленности ключевыми словам
  • Внешние — ссылочная релевантность (учитываются тексты ссылок, которые идут на ваш сайт, их количество и качество ресурсов, с которых они проставлены) и так называемый траст сайта (насколько поисковики ему доверяют)
  • Поведенческие факторы — оценивается поведение пользователей в поисковой выдаче и их поведение на самом сайте (поисковики стремятся, отслеживая это, узнать, насколько страница данного ресурса отвечает данному запросу — оценить правильность определения релевантности)
  • Т.о. ранжирование в выдаче происходит на основе соответствия веб документа введенному пользователем запросу. Тут важно понять, что поисковик всегда будет находиться на стороне пользователя, которому, по большому счету, все равно какой именно ресурс будет находиться вверху поисковой выдачи — ему важно, чтобы на странице этого ресурса он нашел ответ на свой вопрос. А то, что хочет пользователь, то хочет и поисковая система (будь то Яндекс или Гугл).

    Яндекс и Гугл при всей своей грандиозности являются всего лишь сайтами, а значит для них действуют точно такие же принципы — чем больше будет посетителей у них, тем выше будет теоретическая и практическая прибыль. А чем поисковик может привлечь на свою сторону посетителя?

    Правильно, максимально точными ответами на заданные посетителем вопросы, которые называют «по научному» поисковыми запросами (кстати, научившись правильно работать со статистикой поисковых запросов Яндекса и Гугла вы будете всегда идти на шаг впереди ваших потенциальных конкурентов).

    Т.е., чем точнее поисковик сможет определять релевантность веб страниц в Топ 10 вопросу пользователя, тем будет более точное ранжирование и тем довольнее останется пользователь.

    И рубятся поисковики не за копейки, а за огромный и жирнейший кусок, измеряемый миллионами долларов прибыли. Поэтому правильный расчет релевантности, как для Яндекса, так и для Гугла являются жизненно необходимыми. Кстати, раз уж я провел аналогию поисковиков и обычных сайтов, то как вы думаете, а какой у поиска основной источник дохода?

    В общем-то, один из тех, что я уже описывал в своей статье про то, как заработать деньги в интернете. У Яндекса до 90 процентов прибыли идет с рекламных блоков Яндекс Директа в выдаче (для площадок это называется РСЯ), а у Гугла примерно столько же идет с Адвордс (ваш заработок в Адсенс — это его оборотная сторона).

    Теперь, наверное, еще очевиднее стала заинтересованность поисковиков в расширении или хотя бы в удержании имеющейся у них аудитории (количество кликов по объявлениям контекста, как правило, прямо пропорционально посещаемости ресурса). А сделать они это могут, только улучшая механизмы определения соответствия документов запросам посетителей, которые должны получить ответ на свой вопрос как можно быстрее и точнее.

    А что же или кто же мешает Яндексу, Гуглу и другим подвязавшимся на рынке поиска системам правильно оценивать релевантность и проводить четкое ранжирование сайтов в поисковой выдаче? Да, собственно, мы с вами и мешаем — начинающие и продвинутые оптимизаторы, пытающиеся выдать желаемое за действительное. Что делаем мы, проводя в жизнь принципы SEO?

    Правильно, пытаемся обмануть или нагреть поисковики, пользуясь тем, что обмануть программу не так уж и сложно, в отличии от человека. SEO оптимизация позволяет за счет накачки текста ключевыми словами из нужных запросов (настоятельно советую пробивать актуальность используемых ключевых слов в Yandex Вордстат) и проставления внешних ссылок на сайт с нужными анкорами (текстами ссылок) сделать страницу своего собственного ресурса гораздо более релевантной, чем она есть на самом деле. В результате мы поднимемся при ранжировании в выдаче и пользователь Яндекса или Гугла получит не совсем релевантный ответ на свой вопрос.

    Понятно, что такой расклад никак не устраивает поиск, и, следовательно, они будут обязательно бороться с такими методами повышения релевантности. Причем, чем сильнее и наглее вы будете обманывать поисковик, тем сильнее и ощутимее он может вас пнуть (пессимизация, попадание под фильтр и, наконец, бан).

    Особенности расчета релевантности в поисковых системах

    Подробно познакомиться с основными принципами ранжирования, которые присущи всем современным поисковикам, вы можете в статье про то, как работают поисковые системы. Сегодня же я хочу поговорить про те особенности алгоритмов ранжирования, которые имеются у поиска на данный момент, и про то, как можно это использовать в продвижении своего сайта.

    Как вам известно, в рунете доминируют две поисковые системы — Яндекс и Гугл. Рамблер и поиск от Mail.ru на данный момент можно не брать в расчет, тем более, что первый сейчас использует поисковый движок Яндекса, а второй, хоть и отъедает порядка пяти-семи процентов от общего рынка поиска в рунете, но при этом доля этого поисковика неуклонно снижается.

    В связи с этим давайте посмотрим, какие же формулы определения релевантности используют эти два основных игрока рынка поиска в рунете:

  • Яндекс использует формулу ранжирования основанную на системе машинного обучения под названием MatrixNet. В ней построением формулы занимается алгоритм, которому на вход подаются оценки сделанные специальными людьми (асессорами).

    Эти самые асессоры выносят оценки определенному количеству сайтов по определенному количеству запросов. Таким образом осуществляется обучение алгоритма, который подробно изучает помеченные асессорами хорошие и плохие ресурсы, выделяет факторы, по которым можно их ранжировать и уже потом, опираясь на них, сам пытается отделить зерна от плевел в масштабах всего рунета.

    При ранжировании в Яндексе учитывается более 400 факторов. Причем они могут учитываться как отдельно, так и в качестве мономов (произведение нескольких факторов). Следовательно, если один из них в мономе будет нулевой, то он может свести на нет и влияние других, не нулевых факторов. Т.о. мы должны понимать, что не возможно однобокое продвижение — сейчас работает только комплексная раскрутка сайта по всем возможным направлениям.

    Что примечательно, в Яндексе используются отдельные формулы для разных регионов России, отдельные формулы для стран СНГ (Белоруссия, Казахстан и Украина) и Турции. Т.о. алгоритм работает в автоматическом режиме, однако иногда используются полуавтоматические и ручные действия, направленные на корректировку поисковой выдачи в сторону повышения ее релевантности.

  • Информации по типу используемой формулы в Google гораздо меньше. Не совсем ясно, что используется — ручной или самообучающийся автоматический алгоритм на вроде MatrixNet. По слухам, Гугл все же использует ручную формулу ранжирования, аргументируя это тем, что результаты выдачи автоматической иногда могут быть непредсказуемыми (чем, собственно, славится Яндекс).

    По отрывочным сведениям можно сделать вывод, что поиск Google так же использует большое количество факторов ранжирования, но тем не менее несколько меньшее, чем лидер российского проката. Речь идет о паре сотен факторов. И как я уже писал в статье про поисковую систему Google.ru, он имеет отдельные формулы релевантности для разных стран. Внутри же стран разбиения по регионам (как в Яндексе) отсутствует. По крайней мере это можно с точностью сказать применительно к рунету.

  • Основные факторы ранжирования в Яндексе и Гугле

    Внутренние факторы

    Их можно подразделить на три категории:

  • Текстовое ранжирование — насколько текст документа соответствует запросу пользователя
  • Качество контента — насколько данный текст уникален (авторский ли он), насколько он грамотный с точки зрения русского языка и насколько он близок к естественному:
  • Уникальный контент — скопирован ли текст с других сайтов (читайте тут про copypast и способы его пресечения) или же написан вами или профессиональным копирайтером
  • Вторичность контента — недавно Яндекс предоставил в режиме альфа тестирования вебмастерам возможность застолбить за собой авторство на контент, путем добавления текста в соответствующую форму панели Яндекс Вебмастера. Т.о. вас признают автором текста, а все дубли статьи, разошедшиеся по интернету, будут играть уже не во вред, а на пользу вашему сайту. Т.е. копирование вашей статьи будет говорить о добавлении вам авторитетности и, грубо говоря, может быть приравнено к проставленной на вас ссылке. О как.
  • Естественность контента — с помощью математической лингвистики поисковик считает количество вхождений частей речи и сопоставляет его со средним значением по всей остальной базе текстов, которая у него имеется (по корпусу проиндексированных документов). Математика — величайшая из наук (и моя любимая), с помощью нее легко можно будет определить неестественность текста, при попытке искусственно повысить его релевантность лишними ключевыми словами
  • Ненормативная и адалт лексика — лучше этого избегать, ибо текст может попасть под соответствующий фильтр
  • Свойства самого сайта — входят ли ключевые слова в название домена, возраст ресурса и домена, количество страниц:
  • Возраст сайта (с момента попадания в поисковый индекс, а не с момента регистрации домена) и возраст документа, релевантность которого оценивается поисковиком. Это очень важный фактор (что это такое?) в Яндексе (если сайту меньше года, то он не сможет пробиться в Топ по более-менее конкурентным запросам, а полную силу ресурс набирает где-то через три года), да и в Google есть похожий временной фактор, который называется песочница, когда молодые сайты не могут хорошо ранжироваться.
  • Формат документа, релевантность которого оценивается поисковой системой. Лучше всего и в Яндексе, и в Google ранжируются обычные Html документы, а форматы Pdf, Doc и другие, хоть и индексируются, но продвигать лучше именно страницы с ХТМЛ кодом.
  • Использование ключевых слов в Url адресе сайта — поисковики это до определенного момента очень любили, но с некоторых пор за это можно попасть под фильтр Гугла, если он посчитает это нужным.
  • Наличие всплывающих баннеров может привести к пессимизации ресурса (понижении в позициях результата поиска за счет вычитания значения релевантности)
  • Плохие доменные зоны и плохие Ip адреса хостинга — поисковики зачастую гребут всех под одну гребенку и если вам не повезло зарегистрировать домен в заспамленной доменной зоне, или же не повезло купить дешевый или получить хостинг для своего сайта совсем бесплатно на Ip адресе, где висит еще масса ГС ресурсов, то все может быть очень и очень печально в плане плохих позиций вашего сайта. Также, если на вас зарегистрировано много ГС, а вы на те же данные потом регистрируете СДЛ, то его ранжирование может быть занижено из-за анализа поисковиком данных истории WHOIS домена.
  • Внешние или ссылочные факторыранжирования

    Их можно разделить на две категории:

  • Статические факторы, не зависящие от того, по какому именно запросу поисковик должен определить релевантность данного документа. К ним можно отнести page rank, Виц Яндекса и т.п.
  • Динамические факторы или ссылочное ранжирование — насколько релевантны тексты ведущих на данный документ ссылок (надо добавлять в анкоры ключевые слова) тому запросу, который вводит пользователь в поисковой строке.
  • Пользовательские или поведенческие факторы

    Учитывается, как себя ведет пользователь на странице выдачи и как он себя ведет после того, как перешел на сайт:

  • Кликабельность (CTR) вашего ресурса в результатах поиска — один из самых влиятельных поведенческих факторов и одновременно один из самых неоднозначных, ибо если вашего сайта нет в Топе, то и кликов никаких по нему не будет, а если у вас нету кликов, то как вы попадете в топ. Все это приводит к постепенной стабилизации ресурсов находящихся в Топе — их очень сложно будет оттуда выбить именно за счет высокой кликабельности (CTR).
  • Статистика посещаемости — фактор, который может опираться на анализ и учет источников трафика на ваш сайт (поисковый трафик, переходы с закладок и др). Значимость его не так высока, как у кликабельности.
  • Поведение пользователей на странице — могут учитываться активные действия, проведенное на ней время, внутренние переходы и переходы на другие ресурсы.
  • Поисковики могут делать отдельные выборки среди всех пользователей посещающих данную страницу. Например, может отдельно анализироваться поведение посетителей пришедших именно по тому запросу, по которому поисковик в данный момент ранжирует ваш сайт. Может отдельно учитываться поведение пользователей отдельного региона, где вы пытаетесь продвигаться.
  • Для того, чтобы улучшить поведенческие факторы, нужно:
  • Чтобы целевая страница полностью отвечала на поисковый запрос, по которому вы ее продвигаете
  • Желательно, чтобы целевая страница побуждала пользователя к дальнейшим действиям, будь то заказ товара в магазине или же переход к прочтению другой статьи на информационном ресурсе
  • Ваш сайт должен вызывать у пользователей доверие и расположение, для чего необходимо использовать уникальный и приятный дизайн, а также стремиться к тому, чтобы как можно больше отличаться в выгодную сторону от ГС и сателитов
  • Ресурс должен быть удобным для пользователя, ибо юзабилити способно кардинально влиять на дальнейшее поведение посетителя на вашем проекте
  • Нужно думать о привлекательности сниппетов, ибо они напрямую влияют на один из самых значимых поведенческих факторов ранжирования — кликабельность в результатах поиска
  • Страницы вашего ресурса должны одинаково хорошо отображаться во всех популярных браузерах (самых лучших и быстрых), иначе вы потеряете какую-то часть поведенческих плюсов от тех посетителей, которые юзают тот браузер, о котором вы не подумали при верстке
  • На вашем сайте не должно быть проблем с кодировкой текста (кракозябров, например)
  • Ваш ресурс должен работать стабильно и бесперебойно, что в основном определяется качеством хостинга. Аптайм или доступность сайта можно мониторить описанными по ссылке способами.
  • Региональные факторы

    Учитываются при определении релевантности — последнее время они очень заметны в Яндексе, когда в выдачах по какому-либо региону России отдается предпочтение ресурсам относящимся именно к этому региону. Что же будет влиять на ранжирование документа в данном конкретном регионе:

  • Тут важен выбор правильной доменной зоны, соответствующей региону, в котором вы хотите успешно продвигаться (для России — зона «ru» и т.д.).
  • Присвоить сайту соответствующий регион в Яндекс Вебмастере и панели Гугл Вебмастера
  • Употреблять названия требуемого региона в текстах документов и анкорах входящих ссылок для лучшего последующего положения ресурса именно в выдаче по данному конкретному региону
  • Стараться получать входящие ссылки с сайтов, принадлежащих к тому же самому региону, где вы хотите высоко ранжироваться
  • Добавить на страницы своего проекта адреса, почтовые индексы и телефоны того региона, где вы хотите попасть Топ
  • Запросные факторы

    Скорее всего для коммерческих и информационных запросов используются разные формулы расчета релевантности. Также разная формула может использоваться и для различных типов запросов (навигационные, транзакционные и т.п.) и даже количество слов в запросе может влиять на тип используемой формулы.

  • Если сейчас и не используются на полную катушку, то вскоре обязательно будут использоваться так называемые социальные сигналы (особенно в свете достигнутых договоренностей между Яндексом и Твиттером, о котором я писал тут). В рунете социальные сети (влияющие если не сейчас, то в скором времени) — это «В контакте» и Facebook.
  • Станет ли такой влиятельной социалкой и Google+, о которой тут можно почитать, пока не ясно
  • Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru

    Источник: ktonanovenkogo.ru

    НЕТ КОММЕНТАРИЕВ

    Оставить комментарий