Как работает Google PageRank?

Или как работал Google PageRank? Говорят Google отказался от него.

6 Симпатий

PageRank ( PR ) - это математическая формула, которая оценивает «ценность страницы» по количеству и качеству других страниц, которые ссылаются на нее. Его целью является определение относительной важности данной веб-страницы в сети (т.е. во всемирной паутине).

Соучредители Google Сергей Брин и Ларри Пейдж разработали PageRank в 1997 году в рамках исследовательского проекта в Стэнфордском университете. Они описали свою мотивацию следующим образом:

«Наша главная цель - улучшить качество поисковых систем».

Это подводит нас к важному моменту: поисковые системы не всегда были такими эффективными, как Google сегодня. Ранние поисковые системы, такие как Yahoo и Altavista, работали не очень хорошо. Актуальность их результатов поиска оставляла желать лучшего.

Вот что Сергей и Ларри сказали о состоянии поисковых систем в своей оригинальной статье:

«Любой, кто недавно использовал поисковую систему, может легко засвидетельствовать, что полнота индекса не является единственным фактором качества результатов поиска. «Нежелательные результаты» часто стирают любые результаты, которые интересуют пользователя».

PageRank стремился решить эту проблему, используя «граф цитирования (ссылки) в Интернете», который дуэт назвал:

«важным ресурсом, который в значительной степени не используется в существующих поисковых системах».

Идея была вдохновлена ​​тем, как ученые оценивают «важность» научных работ. То есть, глядя на число других научных работ, ссылающихся на них. Сергей и Ларри взяли эту концепцию и применили ее к сети, отслеживая ссылки (ссылки) между веб-страницами.

Это было настолько эффективно, что стало основой поисковой системы, которую мы теперь знаем как Google, и это все еще так.

Как работает Google PageRank?

Вот начальная формула:

PR

Google учитывает три фактора при расчете PageRank веб-страницы:

  • Количество и качество входящих ссылок на страницы;
  • Количество исходящих ссылок на каждой странице ссылок;
  • PageRank каждой страницы ссылок.

Допустим, что страница C имеет две ссылки: одна из страниц A и один из страниц B . Страница A сильнее страницы B , а также имеет меньше исходящих ссылок. Поток этой информации в алгоритме PageRank, и вы получите PageRank на странице C.


источник

Формула PageRank также имеет так называемый «коэффициент демпфирования», который имитирует вероятность того, что случайный пользователь продолжит нажимать на ссылки во время просмотра веб-страниц. Это уменьшается с каждым щелчком по ссылке.

Думайте об этом так: вероятность того, что вы нажмете ссылку на первой странице, которую вы посещаете, достаточно высока. Но вероятность того, что вы потом нажмете ссылку на следующей странице, немного ниже, и так далее, и тому подобное.

Учитывая это, общий «голос» страницы умножается на «коэффициент демпфирования» (обычно предполагаемый равным 0,85) с каждой итерацией алгоритма PageRank.

Если сайт ссылается на страницу с помощью четырех «переходов по ссылкам», значение этой ссылки будет «уменьшено» до такой степени, что конечная страница вряд ли ощутит пользу. Но если они ссылаются на одну и ту же страницу только с помощью двух переходов по ссылкам, эта ссылка окажет сильное влияние на страницу.

Почему Google удалил публичную оценку PageRank?

Вот что сказал представитель Google в 2016 году:

По мере усложнения Интернета и нашего понимания Интернета оценка PageRank панели инструментов стала менее полезной для пользователей как единая изолированная метрика. Удаление отображения PageRank с панели инструментов помогает избежать путаницы среди пользователей и веб-мастеров в отношении значения метрики.

Постарался быть кратким настолько, насколько это возможно…

5 Симпатий

Ларри Пейдж, один из основателей Google, представил концепцию ранга страницы, которая рассчитывается по алгоритму, созданному им самим. Алгоритм учитывает различные факторы, такие как релевантность страницы, стандарт контента, входящие и исходящие ссылки, коэффициент демпфирования и т. д., и, наконец, рассчитывает рейтинг страницы.

2 Симпатий