Главная » Статьи » SEO Оптимизация, раскрутка » Оптимизация и продвижение

Ранжирование. Ссылочное ранжирование (PageRank)

Ранжирование

Ранжированием называется упорядочивание результатов поиска по их релевантности.

Каждая поисковая машина имеют свою «формулу релевантности» для веб-страниц.

В нее входит учет наличия искомых слов на странице, учет плотности этих слов по отношению к остальным словам, наличие компактных вхождений искомого словосочетания, искомых слов в особых текстовых элементах повышенной важности (например, в заголовках) и т.д.

Напомним, что внутренние факторы ранжирования - это параметры, которые владелец сайта или его вебмастер имеет возможность легко изменить самостоятельно.
Условно говоря, к внутренним факторам относится все, что находится "внутри" сайта, - тексты, теги, рисунки, внутренние ссылки.

Стоит только заметить, что не существует единой формулы релевантности не только для всех поисковиков, но и для одного конкретного поисковика, потому что эта «формула» непрерывно развивается и дополняется разработчиками поисковика.

Общая схема алгоритма ранжирования поисковой машины такова:
по запросу поисковая машина находит все вхождения слов запроса в веб-страницу.
Эти вхождения взвешиваются: для вхождений учитывается их компактность (расположение рядом), важность (вхождение в специальные поля - в титул, заголовки, близость к началу страницы), форма и порядок расположения и т.п.
Всем вхождениям назначается вес, а затем веса отдельных вхождений на странице объединяются по некой общей формуле, чтобы получить общий вес (позицию) страницы в результатах поиска.

Возможно, в эту самую минуту, когда вы читаете эти строки, разработчик Гугла или Яндекса добавляет какой-то совершенно новый фактор ранжирования в алгоритм своей поисковой машины, чтобы в очередной раз кардинально улучшить качество ранжирования...

Кроме упомянутых сведений о составе и релевантности текста на самой странице, поисковики анализируют также позицию страницы в общем пространстве Интернета, а именно - авторитетность страницы, которую они вычисляют по количеству ссылок на нее с других сайтов.

Принято разделять два типа влияния ссылок на документ.

Первый связан с авторитетностью ссылки и авторитетностью страницы, или рангом страницы (PageRank).
Кроме того, поисковые машины учитывают тексты ссылок - это принято называть ссылочным ранжированием страниц.


Что такое ссылочное ранжирование (PageRank)

Как уже говорилось выше, поисковые глашины анализируют структуру ссылок веб-страниц друг на друга. Таким образом выясняется авторитет отдельных страниц (и сайтов в целом) среди сетевого сообщества, среди тех, кто создает сайты и делает на них ссылки на другие сайты.

Опять-таки сама по себе эта идея не новая - она представляет собой автоматизацию довольно старой идеи индекса цитируемости, который используется в научном мире для вычисления авторитета ученого.

Идея проста - кого больше цитируют и на кого чаще ссылаются, тот авторитетен, а его работы, очевидно, больше нужны человечеству. Тот же, кого цитируют меньше, человечеству менее интересен.

Поэтому к обычной «текстовой релевантности», основанной на соответствии самого текста страницы запросу, можно добавить «авторитетность» страницы среди других страниц.

Впервые эту идею применили в публичной поисковой машине в конце 1990-х годов создатели Google - Брин и Пейдж, аспиранты Станфордского университета. Для них, конечно, идея научного индекса цитирования была естественной и давно известной.

Именно ссылочный ранг страницы стал основным принципом ранжирования результатов поиска в Google, что привело к резкому отрыву от конкурентов по качеству поиска и стало одной из основных причин доминирования Google в мировом Интернете.

Они назвали этот ссылочный ранг PageRank (ранг страницы), включив заодно в название также и фамилию одного из двух авторов идеи - Ларри Пейджа (Larry Page).


Как определяется ранг страницы

Теоретически идея автоматического использования ссылок для вычисления авторитета страницы выглядит просто: возьмем матрицу всех ссылок всех страниц Интернета друг на друга, т.е. фактически «Интернет в квадрате». Получится матрица гигантских размеров - скажем, двадцать миллиардов на двадцать миллиардов.

Теперь начнем учитывать ссылки страниц друг на друга. Сначала присвоим всем страницам равный вес (ранг). Затем, начиная с какого-нибудь угла этой огромной матрицы, начнем пересчитывать вес страниц и ссылок примерно таким образом: если на страницу ссылается много страниц (т.е. у нее много "входящих" ссылок), то ранг страницы повышается (по некоторой относительно простой формуле).

Будем также учитывать и ранг ссылок.
Ведь ссылка с важной страницы лучше ссылки с малозначительной страницы, не так ли?
Итак, при расчете ранга страницы нужно учесть вес каждой «входящей» ссылки.

Наоборот, если со страницы с неким рангом «уходит» несколько ссылок, разделим ранг страницы между всеми ссылками. Таким образом, если на страницу ссылается очень авторитетный ресурс, то и ранг самой страницы повышатся.

Правда, если этот авторитетный ресурс ссылается еще на тысячи других страниц (скажем, это каталог Yahoo), то авторитет каталога «размажется» по всем тысячам ссылок и нам от него достанется немного (другими словами, ранг нашей страницы повысится незначительно).

Заметим, что после первого цикла пересчета матрицы связей Интернета нам придется вернуться к началу и пересчитать все ранги еще раз, так как ранги страниц, ссылающихся на самые первые страницы (с которых мы начинали), уже изменились.
В итоге, придется сделать много повторов пересчета, так называемых итераций.

Для расчета авторитетности сайта нужно пересчитывать гигантские таблицы ссылок с длиной, равной количеству всех страниц в Интернете. Естественно, технически задача такого пересчета гигантских матриц очень сложна. Именно поэтому Google пересчитывает свой индекс не так уж часто, далеко не каждый день, поскольку для пересчета матрицы связей требуются огромные вычислительные мощности.

В дальнейшем поисковики усовершенствовали идею вычисления авторитетности страницы за счет учета текста на ссылках.
Действительно, почти каждая ссылка в Интернете представляет собой какой-то текст (под который и "подложен", собственно, адрес страницы, на которую ссылаются).Естестве́нно учитывать этот текст при расчете ранга той страницы, на которую ведет ссылка.

Так возникает ссылочный ранг страницы - ранг, учитывающий тему ссылок.


Ссылочный ранг страницы

Допустим, автор сайта написал у себя на сайте фразу "хорошие стрелялки и мочилки для мобильников" и дал под ней ссылку на некоторую страницу «X», повествующую об играх для мобильных телефонов.
Ясно, что эти слова нужно как минимум добавить к индексу этой страницы «X», даже если на самой странице этих слов нет и если она повествует о мобильных играх в более "академическом" стиле.

А если ссылку на страницу «Х» со словом "стрелялки" дали многие вебмастера, то и вес слова "стрелялки" для страницы «Х» надо существенно повысить (хотя его вообще нет на странице А).

Например, в Яндексе можно заметить использование ссылочного ранга, когда в результатах поиска страница помечается как "найдено по ссылке".
Это значит, что страница показана в результатах поиска не потому, что на ней часто встречается ваш запрос, а потому, что он часто встречается на других страницах в ссылках на эту страницу.

Для вебмастера понятие ранга страницы чрезвычайно важно, ибо с помощью управления ссылками, ведущими на сайт и уходящими с сайта, можно влиять на свой ссылочный ранг и, значит, на свое положение в поисковых машинах.


При написании, использовались следующие материаллы: 
Научно-популярное издание: 
Продвижение сайта в поисковых системах
Под редакцией:
И. С. Ашманова, А. А. Иванова




Источник: Ранжирование. Факторы ранжирования, PageRank, Ссылочный ранг страницы, Что такое ссылочное ранжирование
Категория: Оптимизация и продвижение | Добавил: likbezz (19.09.2010)
Просмотров: 6722 | Теги: формула релевантности, итераци, продвижение, seo, Ссылочный ранг, Релевантность, ранжирование, Pagerank, оптимизация
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]