Поисковые алгоритмы ранжирования сайтов. Анатолий КосаревЧитать онлайн книгу.
продукт. Каждая ключевая фраза, введенная пользователем в строке поиска для Google – это вопрос, на который пользователь хочет найти ответ.
Первая цель поисковика понять какой вопрос был задан. Эта задача как известно из обрывков заявлений Google об организации поиска состоит из двух частей.
Это по этим или подобным запросам подобрать лучшие сайты, которые прежде удовлетворили пользователей. Заметьте, не накрученные сайты, а реальные.
Это и на основании прежних запросов этого пользователя понять, что же заданным вопросом (введенной ключевой фразой) пользователь желает узнать. Например, если прежде человек искал характеристики телевизоров и сравнивал их, а после этого набрал в поисковике «мониторы», то вероятнее всего он желает сравнивать теперь мониторы. Если же, Google заметил, что пользователь купил уже и телевизор, и другое в интернет-магазинах, то вероятнее всего имеет намерение купить монитор. Ни для кого не секрет, что Google отслеживает действия пользователя, знает о его намерениях не хуже, чем сам пользователь, и «подсовывает» ему не только рекламу, но и страницы в рамках пожеланий пользователя.
Для Google постоянный пользователь социальных сетей – это открытая книга. Можно представить какой мощностью обладает Google, если сейчас при приеме на работу работодатели стали обращаться к небольшим формочкам, которые собирают в социальных сетях всю открытую информацию, например с кем дружит, на кого подписан, что комментирует и репостит. Вторая цель – подобрать страницы и вывести их пользователю первыми, чтобы ознакомившись с первой же, посетитель получил ответ на свой вопрос. Согласитесь, что эта задача – искусственного интеллекта, и все больше напоминает разговор людей: один задает вопрос, а другой отвечает. Заметьте Google оценивает и ранжирует разные ответы на поставленный вопрос.
Резюме от Google
Google – имея миллиарды страниц с помощью алгоритмов научился определять какие веб-страницы отвечают на запросы пользователей, а какие имитируют свою полезность.
К наиболее распространенным способам имитации качества полезности и авторитетности Google относит следующие:
· Автоматически сгенерированное содержание:
o Текст, который бесполезен для читателей, но содержит ключевые слова, часто используемые в поиске.
o Текст, который переведен с помощью автоматического инструмента и опубликован без редактирования.
o Текст, созданный с помощью автоматических средств, например, цепей Маркова.
o Текст, созданный автоматически с помощью методов подбора синонимов.
o Текст, сформированный путем копирования контента из фидов Atom/RSS или результатов поиска.
o Контент, скопированный с различных веб-страниц без добавления уникальной информации.
· Участие в схемах обмена ссылками, например,
o Покупка или продажа ссылок, которые учитываются в системе PageRank. К этой категории относится выплата