Москва
(495)240-82-20
Ростов-на-Дону
(863)219-77-00
   

Внешние и внутренние факторы, влияющие на позиции сайта в поиске

Внешние и внутренние факторы, влияющие на позиции сайта в поиске
09.09.2011
Доклад семинара "Гуру про Интернет-2011"
Введение
Эволюция алгоритмов Яндекса
Арзамас (Анадырь)
Снежинск
Конаково
Обнинск
Краснодар
Факторы ранжирования
Внешние факторы
Внутренние факторы
Поведенческие факторы

Введение

Стоит отметить, что в данном сообщении будет говорится о факторах ранжирования, которые могут применяться к сайтам не только в Яндекс, но и в других поисковых системах. Однако, особое внимание будет уделяться именно поисковой системе Яндекс. По данным LiveInternet, в мае 2011 года доля поиска Яндекса на российском рынке составила 64,8%, а месячная аудитория портала yandex.ru — более 40 миллионов человек (comScore, май 2011). (источник http://company.yandex.ru/news/press_releases/2011/0623/index.xml) Кроме того, поиск Яндекса работает, например, на Livejournal.ru, Nigma.ru, Qip.ru, Rambler.ru

График

На сегодняшний день уже не приходится говорить о важности наличия сайта компании. Все прекрасно понимают, что сайт - это новый канал продаж, «лицо» компании в сети Internet.

Для того, чтобы сайт работал на компанию, он должен приносить клиентов (или достигать поставленных целей: посещаемость, просмотр промо видео, нажатие кнопки «like» и т. п.). Поисковая оптимизация (SEO1*) - это один из инструментов, позволяющих добиться отдачи от вашего сайта. Качественное белое2* SEO обеспечивает сайту высокие позиции в поисковых системах, что даёт целевой трафик на сайт. Некоторый процент посетителей становиться клиентами (конвертируется в клиентов). При этом белое SEO подразумевает, что сайт будет находится на первых страницах результатов поиска в поисковых системах (топ-103*) и к сайту не будут применяться санкции от поисковых систем, т. к. продвижение сайта происходит белыми методами. В черном SEO используется запрещенные методы, которые могут дать быстрый, но лишь кратковременный эффект при этом с большой долей вероятности незамедлительно последуют санкции от Яндекс (а также и других поисковых систем) и ваш сайт исключат из результатов поиска. Поэтому качественное белое SEO важно, если вы хотите получить полноценную отдачу от вложений в ваш сайт. Не зная всех тонкостей поисковой оптимизации можно неумышленно нарушить лицензию на поиск (http://company.yandex.ru/legal/termsofuse/) и тем самым только навредить сайту, поэтому лучше обращаться к профессионалам, как минимум, за консультацией.

Эволюция алгоритмов Яндекса

Прежде чем говорить о факторах влияющих на позиции сайта, стоит уточнить некоторые определения и разобраться как устроена сама поисковая система. Во-первых, поисковая система должна уметь определять для любого запроса какая страница отвечает на него, какая страница даёт более лучший ответ, а какая - нет. Для того, чтобы научится определять лучший ответ поисковая система проводит анализ свойств веб-страниц и поисковых запросов, определяет какие-то признаки, находит характерные сходства и отличия в поисковых запросах. Все признаки веб-страниц можно сгруппировать в 3 большие группы: статические, динамические, запросные факторы. Статические относят к самой странице. Например, это может быть количество ссылок. К внутренним факторам (динамические) относят, например, количество в тексте страницы слов из запроса, их расположение, словоформу. Также у запроса могут быть свойства, например, геозависимость - это означает, что для хорошего ответа на этот запрос нужно учитывать регион, из которого был задан запрос. Все свойства веб-страницы и запроса, которые можно измерить числами, называются факторы ранжирования.

ЯндексНа сегодняшний момент Яндекс учитывает множество различных факторов, которые могут влиять на позиции сайта. Постоянно совершенствуются алгоритмы, они становятся сложнее для понимания оптимизаторами, всё это сказывается на сроках вывода сайта в топ-10 и цене на услуги SEO. С изменением в алгоритмах Яндекса менялись и подходы в SEO. С июля 2007 года Яндекс начал публиковать новости о введение новых алгоритмов. С мая 2008 алгоритмам стали даваться имена. Качество результатов поиска постоянно улучшается, оптимизаторы с каждым алгоритмом замечали усиление одних факторов ранжирования или появление новых. В мае 2008 года появился алгоритм «Магадан». Вместе с ним появилось понятие «трастовость»4* в отношении к определенным сайтам. Также в поиске начали участвовать слова из URL: кроме слов из текста страницы, участвуют перевод и транслитерация частей URL. Благодаря этому поиск понимает, что «mail» -- это «почта», а «bmw» -- это «бмв». В «Находке» в сентябре 2008 года новый подход к машинному обучению. Стали учитываться сочетания слов, которые в раздельном написании означают то же самое, что и в “склеенном” виде (теперь по запросу [авто ваз] найдутся страницы и со словом “автоваз”).

Арзамас (Анадырь)

АрзамасВ апреле 2009 г. Яндексом выложен следующий алгоритм под названием “Арзамас”, в котором:
Яндекс научился лучше понимать русский язык, разрешая неоднозначности слов в запросах;
– учитывается регион пользователя, результаты поиска по одному и тому же запросу в разных регионах стали разными, всего выделено 19 крупных регионов;
– сайтам присваивается регион, который зависит от ip-адреса хостинга, контактных данных на странице или настроек в Яндекс.Каталоге;
– запросы поделились на геозависимые и геонезависимые, вводятся региональные формулы ранжирования;
– в подсказке об опечатках учитывается настройка языка браузера при определении языка запроса (в сложных случаях);
– введены жесткие фильтры для страниц с попандер-баннерами, а также кликандер и бадиклик (clickunder и bodyclick);
– улучшена формула по многословным запросам.

Снежинск

СнежинскНоябрь 2009 г. ознаменован выходом в свет алгоритма под названием “Снежинск”, где:

– введены дополнительные параметры ранжирования (нескольких тысяч поисковых параметров для одного документа);
– внедрение дополнительных региональных факторов;
– запуск самообучающейся системы MatrixNet,
– замечено плохое влияние объемных текстов с частым повторением ключевого слова;
– стал лучше поиск оригиналов (первоисточников) контента;
появились фильтры АГС.

Конаково

Алгоритм “Конаково” появился в декабре 2009 г., как усовершенствование версии “Снежинск”. В нём было улучшено лишь локальное ранжирование. Теперь ранжирование сайтов различно не только в 19 крупных регионах, но и в 1250 городах по всей России. В этот период в Яндексе также появился новый язык запросов.

Обнинск

ОбнинскАлгоритм “Обнинск” вышел в свет в сентябре 2010 г., в нём:

– улучшено ранжирование по гео-независимым запросам (таких в потоке до 70 процентов) пользователей из России;
– объём формулы ранжирования составил 280 Мбайт;
– ограничено влияние искусственных ссылок на ранжирование;
– расширился словарь транслитерации и улучшен ответ на запросы, заданные латиницей;
– улучшено определение авторства текста.

Краснодар

КраснодарПоследняя смена алгоритма произошла в декабре 2010 г.. Для нового алгоритма Яндекса под названием Краснодар разработана специальная технология Спектр.

– Яндекс классифицирует запросы, выделяя из них объекты (имена, модели авто и др) и присваивая запросам категорию (товары, лекарства, поэты и др.);
– дополнительные слова из спектра запроса также вносят вклад в ранжирование;
– для улучшения качества выдачи учитываются некоторые поведенческие факторы;
– обновлено ранжирование по геозависимым запросам.

Также за этот период Яндекс проиндексировал соц.сеть вконтакте и ввёл расширенные сниппеты5* для многих типов организаций.

Результат запроса яндекса

Яндекс на этом не останавливается, а работает и поныне, совершенствуя свои алгоритмы и улучшая качество выдачи.

Факторы ранжирования

Факторы ранжирования

Отслеживая изменения в алгоритмах, а также анализируя изменения в поисковой выдаче можно сделать выводы об усилении одних факторов или изменения степени важности других факторов. Наблюдая за развитием поисковых систем оптимизаторы собрали целый массив факторов, которые учитываются при ранжировании сайтов в Яндекс. Влияние одних факторов не менялось с развитием, влияние других ослабевало, появлялись новые.

Внешние факторы

Все внешние факторы можно так или иначе отнести к ссылкам на веб-страницы. Повлиять на эти факторы очень сложно в отличие от внутренних.

Внешние факторы:

  • количество и качество ссылок;
  • возраст сайта;
  • уровень доверия к сайту («трастовость»).

Если влиять на возраст и трастовость сайта весьма затруднительно, то на количество и качество ссылок уже можно повлиять. Только поисковые системы категорически не приветствует любые виды накруток любых факторов, целью которых является влияние на ранжирование, а не реальное улучшение качества сайта. Результат таких накруток не может быть долговременным и надежным.

Возраст сайта может влиять на ранжирование. Молодые сайты не так быстро индексируются и им сложнее занять более высокие позиции по сравнению с старыми сайтами.

Ресурс, который имеет большое количество качественных ссылок будет ранжироваться выше, если его сравнивать с идентичным сайтом, но с меньшим количеством ссылок. Под качеством ссылки понимают вес, который она может передать сайту. Простая логика: чем больше ссылок на сайт, тем авторитетнее и интереснее информация и соответственно сайт с большим количеством ссылок должен иметь в результатах поиска высшую позицию. Но как только оптимизаторы поняли эту логику, они начали злоупотреблять этим, вскоре поисковые машины эволюционировали и начали отсеивать ссылки и учитывать и другие факторы. На сегодняшний день ссылки по прежнему остаются одним из ключевых факторов. К ссылкам стал предъявляться ряд требований. Работа с этим фактором стала гораздо вдумчивей, чем она была раньше. Более тщательно подбираются площадки, где будет размещаться ссылка. Ссылки, которые работали, приносили пользу сайту раньше, сейчас уже не смогут принести эту пользу. При этом Яндекс заявляет, что он борется с покупными ссылками.

Внешние факторы

С развитием сети интернет росло количество и сайтов и нельзя было ранжировать их в поисковой выдаче только по нескольким факторам, ключевую роль среди которых играло кол-во ссылок. Поисковые алгоритмы научились обращать внимание на качество,
уникальность представленного контента, степень наполненности сайта, т. е. увеличилось число внутренних факторов.

Внутренние факторы

Среди внутренних факторов контент6* наравне со ссылками занимает одну из ключевых ролей. Поисковые системы делают попытки определения авторства текста, его семантики7*. Предпочтения отдается сайтам с уникальным контентом. Текст на сайте не должен повторяться, на всех страницах должен быть разный текст с высокой уникальностью. Объем текста, разнообразие оформления также может влиять на ранжирование сайта.

В сети множество ресурсов дублирует информацию, но сейчас Яндекс и Google делают попытки определения первоисточника-автора, и из результатов поиска просто исключаются сайты дубликаты. Таким образом, качество результатов поиска улучшается и становится более разнообразным. На сегодняшний момент алгоритмы определения авторства не совершенны и не всегда автор определяется верно.

К оформлению контента на сайте также предъявляются требования от поисковых систем, т.е. правильное оформление также можно отнести к факторам участвующим в ранжировании сайта. Хороший контент и семантическая верстка вместе дают преимущество. Семантическая верстка ? это верстка с правильным использование HTML тегов. В тегах <h> должны быть заголовки, в тэгах <p> абзацы текста, список оформлять <ul>. Сайт, который прошел проверку валидации W3С будет иметь преимущество. Многие поисковые системы предлагают использовать на сайте специальную разметку в миркроформатах. Это позволяет им легче определять контакты, другую дополнительную информацию и формировать информативный для пользователей сниппет в поисковой выдаче. Использование микроразметки в любой не существующий информации или скрытой может быть расценено как поисковый спам.

Корректный HTML код документа позволяет роботам поисковой системы правильно индексировать документ и выделять значимую часть документа. Кроме этого, валидный код корректно отображается в различных браузерах и дает возможность посетителям без проблем ознакомится с содержимым сайта, что косвенно может повлиять на пове денческие факторы, о которых подробнее будет сказано позже.

Среди тегов, которые могут повлиять на вес ключевого слова, а следовательно и на релевантность поисковому запросу и позиции сайта всегда были тэги <h1-h6>, <title>, <strong>, <keywords>, <description>, <ul><ol><li>, <b>, <p>, <em>. Важно понимать, что семантическая верстка предназначается не для поисковых роботов, а для удобства посетителей сайта. Поэтому не следует злоупотреблять заключением ключевого слова во все эти тэги, а употреблять его только в разумных количествах и в нужных местах.

Стоит отметить, что имея общее представление о том, что может влиять на позиции сайта, не стоит думать, что используя все знания о факторах можно только улучшить позиции сайта. Неоправданное использование, например, тегов <strong> на странице, или
чрезмерное насыщения текста страницы ключевыми словами может привести к плачевным результатам. Все факторы рассматриваются не как факторы однозначно влияющие положительно, а как факторы, которые могут влиять как положительно, так и отрицательно.

Отдельно внимание стоит обратить на влияние ключевого слова в тексте на ранжирование. От того, где, как и сколько раз употребляется ключевое слово на странице зависит очень многое. Поисковая система может посчитать страницу как оптимизированную, с целью повлиять на результаты поиска (что не приветсвуется ни одной поисковой системой) и пессимизировать (т.е. принудительно занизить позицию или вообще исключить из результатов поиска), так и посчитать документ наиболее релевантным запросу пользователя и ранжировать такую страницу достаточно высоко. Содержание ключевого слова в заголовках (тэги <h> <title>) также может сказаться на ранжировании. Прямое вхождение ключевого слова, плотность этого ключевого слова, близость ключевого слова к началу заголовка и длина заголовка может оказать существенное влияние и повысить вес этого ключевого слова. При этом важно помнить, что наличие одинаковых <title> страниц может отрицательно сказаться на ранжирование. Чаще всего дублирование заголовков страниц наблюдается в различных каталогах, где не настроена CMS.

Содержание ключевого слова в тексте страницы также очень важный фактор. Стоит очень осторожно относится к плотности ключа на странице и его распределению и формы вхождения (прямой или не прямой – разбавленной другими словами). Удаление частей словосочетания друг от друга также может сказаться на весе ключевого запроса. Если ключ указан в теге <keywords>, то он должен встречаться и в тексте на странице. Сейчас на многих сайтах можно встретить пустые <keywords>, но это не означает, что влияние этого тэга исчезло, оно лишь уменьшилось. После того как оптимизаторы начали писать в <keywords> длинные списки запросов, поисковые системы поняли, что их пытаются обмануть и перестали уделять столько внимания этому тэгу, переключившись на другие вещи и учитывая новые факторы.

Кроме уникальности контента, валидной разметки, плотности ключа в документе, комбинаций использования тэгов есть и другие внутренние факторы.

Настройки сервера также могут повлиять на отношение поисковой системы к сайту. Верные ответы сервера помогают роботу правильно понять какая страница не существует, какая страница временно перемещена и куда, а какая страница перемещена на новый постоянный url. Если меняется структура сайта или CMS, то рекомендуется сделать перенаправление с использование 301 редиректа на новые url. Правильное исользование редиректа поможет пользователям найти нужную информацию по новым адресам, а также сохранить ссылочную массу сайта.

В случае же, когда ответы сервера настроены неверно, например, вместо кода 200 (всё ok), будет отдавать код 404, то поисковая система может посчитать, что страница не доступна и исключить ее из результатов поиска. Встречаются примеры, когда при вводе
неправильного адреса или размещения некорректной ссылки выдается не ошибка 404, а идет редирект на главную страницу. В таких случаях есть риск наплодить дубли главной страницы, доступные по разным адресам.

404 ошибка Яндекса

Поисковая система в таком случае может применить санкции. Отсутствие большого количества 404 ошибок, высокая скорость загрузки, использование правильных кодов ответа - всё это факторы, которые положительно влияют на ранжирование сайта. Кроме того, высокая скорость загрузки страниц сайта положительно сказывается на конверсии страниц. Также не стоит забывать о файлах robots.txt и sitemap.xml Эти два файла помогают облегчить роботу обход сайта и указать роботу, что стоит индексировать, а что нет. В последнее время участились случаи, когда из-за неправильного настроенного файла robots.txt доступными для поиска в различных поисковых системах стали документы, которые никогда не должны были быть общедоступны. Поэтому внимательно относитесь к составлению содержимого файла robots.txt и если вы не уверены в правильности ваших действий, то лучше обратится к профессионалам.

Хостинг также можно отнести к факторам, который может повлиять на позиции. Сейчас есть примеры, когда Google банил8* сайты за размещение на неблагонадежном хостинге. О качестве хостинга было принято такое решение потому, что по мнению Google на этом хостинге было размещено слишком много спамных сайтов (сайтов нарушающих поисковую лицензию поисковой системы). Кроме наличия ключевого слова в тексте, также на позиции может повлиять его наличие в имени домена и в url веб-страницы. Для этого используют ЧПУ (человеко-понятные url). Важную роль в распределение веса между страницами играет перелинковка - связывание страниц сайта внутренними ссылками. Грамотная перелинкова способна значительно повлиять на позиции сайта. Наличие карты сайта дополнительный плюс.

С широким распространением CMS9* можно говорить о появлении нового фактора: влияние CMS на позиции сайта. С одной стороны поисковой системе всё равно на какой системе сделан сайт, какой шаблон используется. Но, как правило, хороших сайтов
с уникальным контентом, продуманной структурой, перелинковкой не может быть сделано много на одной CMS с одинаковыми бесплатными шаблонами. Также в распространенных CMS могут быть ошибки в верстке, что отрицательно сказывается на ранжировании.

Поведенческие факторы

На сегодняшний день ходит много споров о таком факторе и степени его влияния на позиции. С одной стороны поведение посетителей перешедших на сайт по разным запросам будет сильно различаться. Кто-то ищет общую информацию, будет просматривать много страниц, долго знакомится с содержимым, а кто-то пришел на сайт по геоинформационному запросу и ему нужны контактные данные и адрес организации, он просмотрит только одну страницу и быстрей уйдет с неё. В таком случае сделать вывод о том где лучшая характеристика поведения посетителя алгоритмам поисковой системы достаточно сложно. Оба посетителя получили нужную им информацию, но сценарии их поведения различны. Это вызывает сомнения по поводу значительного влияния на ранжирование поведенческого фактора. Но как правило, сайт, который интересен посетителям, даёт ответы на их вопросы, посетители просматривают много страниц, находятся продолжительное время на сайте, такой сайт ранжируется высоко. Количестве кликов совершенное по ссылке также можно отнести к поведенческому фактору, ведь если по ссылке часто кликают, эта ссылка вызывает интерес, плюс к большому кол-ву кликов, посетитель перешедший по ссылке заинтересовался сайтом (низкий показатель отказов), то такой сайт скорее всего будет иметь приоритет в результатах поиска. Сведения об интересах пользователей поисковые системы могут получать из различных источников. Из сервисов закладок, систем веб-аналитики установленных на сайтах или плагинах установленных у пользователя в браузере. Многие связывают с поведенческими факторами будущее, считают, что усиление этого фактора будет происходить, а поисковые системы усовершенствуют отслеживание посетителей, чтобы получать необходимы им данные.

С развитием поисковых алгоритмов ослабевает степень влияния одних факторов и усиливается степень влияния других, либо появляются новые факторы. Отслеживание изменений в результатах поиска позволяет делать выводы о влиянии факторов на ранжирование или их появлении. С совершенствованием поисковых систем совершенствуются и методы поисковой оптимизации сайтов. Но главным всегда оставалось то, что сайтв первую очередь ориентирован на людей. Создание сайта для людей сделает его популярным и не нужно будет заботится о факторах, которые будут влиять на позиции сайта. На всём протяжении своего существования поисковые системы доказывают этот тезис - делайте сайты для людей.