Как работает ранжирование в Google поиске

Як працює ранжування в Google пошуку

Новий документ, що очікує на візит Google бота
Система індексації Google – Alexandria
Механізм пошуку та ранжування QBST
Первинний аналіз запиту
Зв’язування з індексом Google
Ранжування результатів
Обробка спеціальних запитів
Ascorer: Створення «зеленого кільця»
Superroot: Перетворити 1000 на 10
Як працюють Twiddlers?
Очінщики якості Google і RankLab
Як NavBoost допомагає ранжуванню
GWS — місце відображення результатів пошуку
Основні висновки для SEO оптимізації

На результати видачі впливає понад 1000 факторів ранжування, і ми не знаємо їхніх точних вагових коефіцієнтів, до того ж частина чинників – приховані пошуковою системою. Навіть співробітники Google, які безпосередньо працюють над алгоритмами ранжування, не можуть пояснити, чому той чи інший результат перебуває на одній із топових позицій. Розуміння структури пошукової системи пояснює: чому іноді добре оптимізовані сторінки не ранжуються, а короткі та/або малоінформативні сторінки потрапляють у ТОП. Джерелом основної інформації цієї статті є матеріал: How Google Search ranking works

Новий документ, що очікує на візит Google бота

Коли ви запускаєте новий сайт, його індексування не відбувається миттєво. Google дізнається про сайт через оновлену карту сайту або через посилання, розміщені на вже відомих сторінках. Головна сторінка та інші популярні сторінки часто швидше привертають увагу Google. Краулер витягує новий контент, а планувальник керує частотою його відвідувань, вирішуючи, коли повернутися для перевірки оновлень.
Деякі сайти, особливо ті, що вважаються спамними або малозначущими, можуть потрапити в «пісочницю», де вони проходять додаткові перевірки. Частота обходу сайту залежить від його трафіку: що більше відвідувань, то частіше сайт обробляється.

Варіанти виявлення нового документа Google-ботом

Система індексації Google – Alexandria

Система індексації Google (Alexandria) присвоює кожному документу унікальний DocID. Якщо контент уже існує (наприклад, у разі дубльованих сторінок), новий ID не створюють – URL пов’язують з наявним DocID.
Кожен фрагмент сайту індексується за ключовими фразами, які поміщаються в прямий і зворотний індекси. Наприклад, наш умовний документ – про олівці. Слово «олівець», яке часто трапляється на сторінці, буде додано до зворотного індексу з прив’язкою до відповідного DocID, що збільшує його значущість у пошуковій видачі.

Присвоєння ідентифікаторів

Кожному документу присвоюється:

Унікальний ідентифікатор (Document ID):
  • Генерується автоматично під час додавання документа в систему. Зазвичай це довгий рядок символів або чисел, наприклад:
    doc-98765a4b-cdef-1234-5678-90abcdef1234
Метадані:
  • Опис документа: назва, автор, мова, дата публікації
  • Технічні параметри: розмір файлу, формат, дата завантаження
  • Категорії та ключові слова для тематичної класифікації
Логічні посилання:
  • Зв’язок з іншими документами

Кожному DocID присвоюється алгоритмічно розрахована оцінка IR (information retrieval – цей показник можна інтерпретувати як міру тематичної релевантності документа. Це кількісна характеристика, яка допомагає системі визначити, наскільки документ відповідає запиту і де він має бути розміщений у результатах пошуку).

Приклад

У нашому документі слово «олівець» виділено жирним шрифтом у тексті та міститься в H1. Такі та інші сигнали збільшують оцінку IR щодо слова «олівець».

Система індексації Alexandria присвоює документу унікальні ідентифікатори

Крім іншого, Google відстежує останні зміни в документах, і якщо контент змінюється занадто сильно або різко, алгоритми можуть обнулити всі старі сигнали. Документи та їхні версії зберігаються в репозиторії, і з плином часу Google аналізує зміни. Щоб змінити тему документа або оновити його, потрібно пройти через кілька проміжних версій, інакше старі сигнали залишаться в системі.
Важливо також зазначити, що при зміні адміністратора і змісту домену одночасно, всі старі SEO-сигнали обнуляються.

Механізм пошуку та ранжування QBST

Коли користувач вводить запит, приміром, зі словом «олівець» у пошуковому рядку Google – починається процес його обробки в системі QBST.

QBST – механізм пошуку та ранжування на основі запитів

Процес роботи QBST:

Первинний аналіз запиту

QBST аналізує текст запиту користувача, щоб зрозуміти його намір (інтент). Це дає змогу Google вибирати між різними типами результатів. Інтент уточнюється додатковими ключовими словами або попередніми діями користувача.

Простими словами, Гугл хоче зрозуміти, що Вам показати, тобто, якого типу це має бути контент: інформаційний, навігаційний, комерційний, транзакційний або розважальний.

Зв’язування з індексом Google

Після інтерпретації запиту QBST взаємодіє з індексом Google. Завдання – знайти найбільш релевантні документи:

Ключові слова: система шукає збіги між словами в запиті та текстом у документах
Семантичний аналіз: використовується машинне навчання для розуміння синонімів і контексту. Наприклад, запит «найкращі олівці» може повертати результати, пов’язані з «топ олівців» або «популярні олівці»
Історичні дані: враховуються попередні запити користувача, щоб пропонувати персоналізовані результати

Ранжування результатів

Система QBST використовує складні алгоритми для сортування результатів на основі таких факторів:

Релевантність: наскільки документ відповідає запиту
Якість контенту: оцінюється структура, оригінальність, корисність
Авторитетність джерела: враховується репутація сайту
Поведінка користувачів: аналізуються дані, такі як кліки, час на сайті, повернення до пошуку
Локалізація: якщо запит локальний, результати враховуватимуть розташування користувача

Обробка спеціальних запитів

QBST також підтримує розширені функції: голосові запити, картографічні запити, мультимедіа.

Короткий опис процесу роботи механізму пошуку та ранжування

Після цього, відповідні терміни (у нашому прикладі – «олівець») передаються в систему Ascorer для подальшої обробки.

Ascorer: Створення «зеленого кільця»

Система Ascorer бере зі зворотного індексу 1000 найбільш релевантних документів (DocID) для запиту «олівець» і сортує їх за IR-оцінкою. Цей список називають «зеленим кільцем» або posting list (списком публікацій).

Ascorer входить у систему ранжування Mustang, яка далі відбирає результати. Вона застосовує такі методи, як:

  • Видалення дублікатів за допомогою SimHash (відбитки документів)
  • Аналіз фрагментів тексту
  • Перевірка оригінальності та корисності контенту

Мета – вибрати 1000 кандидатів, які потім оцінюються для потрапляння в топ-10 результатів, які називаються «синім кільцем». На цьому етапі наш документ про олівці посідає умовне 132-ге місце в списку публікацій. Якщо фільтрації більше не буде, це місце залишиться фінальним.

Superroot: Перетворити 1000 у 10

Система Superroot займається повторним ранжуванням, виконуючи точну роботу зі скорочення «зеленого кільця» (1000 DocID) до «синього кільця», яке містить лише 10 результатів. Для цього завдання використовуються Twiddlers і NavBoost. Можливо, задіяні й інші системи, але їхня точна роль залишається неясною через брак інформації.

Mustang генерує 1000 потенційних результатів, а Superroot фільтрує їх до 10 результатів

Як працюють Twiddlers?

Twiddlers – це спеціальні інструменти (подібні до плагінів), які допомагають фільтрувати й ранжирувати документи в пошуковій системі без необхідності змінювати складні алгоритми, такі як Ascorer. Їх багато, і кожен із них виконує окреме завдання, покращуючи роботу на різних етапах.

Принцип роботи Twiddlers:
PreDoc Twiddlers: швидко обробляють сотні документів, використовуючи мінімальні дані, щоб скоротити список для подальшого аналізу.
Lazy Twiddlers: працюють повільніше, оскільки потребують більше інформації, але застосовуються до вже зменшеного списку.

Деякі Twiddlers змінюють оцінки релевантності документів (IR), наприклад, підвищують новинки або різноманітність контенту, а інші – рухають документи вгору або вниз у результатах пошуку. Вони економлять ресурси системи і роблять видачу більш корисною та релевантною.

Різниця роботи PreDoc і Lazy Twiddlers
Приклад поліпшень за допомогою Twiddlers

Як Ви пам’ятаєте, наразі наш документ посідає 132-ге місце в пошуку.
Один Twiddler, який підвищує нові документи, збільшує його оцінку в 1,7 раза, піднімаючи до 81-го місця.
Інший Twiddler знижує позиції документів, схожих на наш, звільняючи місце, і наш документ піднімається ще до 69-ї позиції.
Twiddler, що обмежує кількість блогів у результатах, піднімає нас до 61-ї позиції (тобто, для комерційного запиту виключає з видачі інформаційні статті з блогів).

Складніші приклади

Twiddler, налаштований на комерційні запити, піднімає нашу сторінку ще на 41 позицію.
Інший Twiddler прибирає сторінки зі спамом, і наш документ доходить до 38-го місця.
Twiddler, що оцінює, наскільки наш сайт пов’язаний з темою (письмове приладдя), піднімає нас до 14-ї позиції.

Інші функції

Деякі Twiddlers додають анотації для поліпшення відображення сніпетів (наприклад, зображень або тексту). Вони також враховують, що запити можуть бути різними (купівля, інформація, навігація) і регулюють видачу залежно від цього.

Оцінювачі якості Google і RankLab

Оцінювачі якості (експерти, які виконують ручну перевірку релевантності та корисності результатів пошуку на основі суворих протоколів Google) відіграють ключову роль у непрямому впливі на алгоритми Google, допомагаючи навчати системи машинного навчання. Хоча їхні оцінки безпосередньо не впливають на ранжування, вони формують критерії, за якими алгоритми розуміють, які сторінки заслуговують на довіру і відповідають очікуванням користувачів.

Ручна перевірка релевантності та корисності результатів пошуку
Як це працює?
Збір оцінок: оцінювачі аналізують результати пошуку, оцінюючи контент за низкою питань, таких як:
  • Чи явно вказані автор і дата публікації?
  • Чи відповідає інформація професійним знанням?
  • Відповіді записуються і використовуються для навчання алгоритмів
Показники та екстраполяція:
  • Алгоритми вивчають характеристики якісних сторінок, виявляючи ключові ознаки, такі як наявність фотографії автора, повного імені та посилання на біографію LinkedIn
  • Ці ознаки можуть потім стати сигналами ранжування. Наприклад, сторінки з авторськими даними можуть бути підвищені в рейтингу, а їх відсутність – навпаки, знецінена
Навчання алгоритмів:
  • Оцінки експертів збираються в показник задоволеності інформацією (IS)
  • Якщо для сторінки IS-показник недоступний, система екстраполює дані на основі схожих шаблонів
«Золоті» документи:
  • Деякі документи можуть бути визнані еталоном якості («золотим стандартом»), що сприяє їхньому просуванню
  • Такі документи можуть отримати підтримку Twiddlers, які просувають їх у топові позиції, наприклад, у першу десятку
Вплив на ранжування
  • Twiddlers і нейронні мережі
    • Після позитивних тестів алгоритми, спираючись на дані від оцінювачів, інтегрують виявлені ознаки через Twiddlers, впливаючи на ранжування
    • Це створює більш точне налаштування видачі, враховуючи не тільки структуру контенту, а й репутацію авторів
  • AuthorVectors і «відбиток автора»
    • Google може враховувати стиль письма автора, ідентифікуючи його через AuthorVectors, що посилює значення авторського контенту
  • Експерименти в RankLab
    • Власні експерти Google розробляють і тестують Twiddlers, оцінюючи їхній вплив на якість видачі та ефективність у боротьбі зі спамом
    • Тільки перевірені Twiddlers інтегруються в систему Mustang, що відповідає за фінальну обробку результатів
Висновок

Щоб підвищити позиції в пошуковій видачі, варто враховувати ці аспекти:

  • Забезпечити прозорість авторства, включно з фото, ім’ям і біографією
  • Зосередитися на створенні контенту, який може відповідати «золотим» стандартам
  • Регулярно аналізувати SERP і адаптувати стратегію залежно від виявлених змін

Чого хочуть користувачі? Як NavBoost допомагає ранжуванню

Робота системи NavBoost та її складових

NavBoost – це система Google, яка допомагає керувати результатами пошуку для мобільних, десктопних і локальних запитів. Хоча Google офіційно заявляє, що дані про кліки не впливають на ранжування, внутрішні документи говорять про протилежне. Система дійсно враховує кліки, час на сайті та поведінку користувача (наприклад, дані з браузера Chrome), щоб визначити, які сторінки дають найкращий користувацький досвід.

Як працюэ NavBoost
  1. Дані про кліки та час на сайті:
    • Сторінки, на яких користувачі проводять більше часу і які стають їхнім останнім кліком у пошуку, вважаються більш релевантними
    • Якщо у сторінки низький CTR (відсоток кліків за посиланням), вона може втратити позиції. Високий CTR і задоволеність користувачів навпаки підвищують сторінку у видачі
  2. Аналіз поведінки:
    • NavBoost використовує дані про те, як користувачі взаємодіють з результатами, щоб запропонувати більш якісні сторінки
    • Система мінімізує маніпуляції за допомогою алгоритмів стиснення даних і захисту від ботів
Як NavBoost допомагає новим сторінкам
  • Новим сторінкам тимчасово передається вага головної сторінки («NearestSeed»), доки вони не наберуть власних сигналів, таких як кліки, зворотні посилання або трафік
  • Якщо нова сторінка показує низький CTR, вона швидко втрачає позиції, але якщо кліки і залученість високі, то позиції зростають
  • Система адаптується до змін, наприклад, до сезонних запитів або нових користувацьких патернів
Додаткові факти
  • Довгостроковий аналіз: Google зберігає метрики 13 місяців, щоб вивчати тенденції
  • Брендові сигнали і трафік: Популярні сторінки або ті, які згадуються в брендовому контексті, швидше потрапляють у топ видачі
  • Мінімізація персоналізації: Google намагається показувати загальні результати, які краще передбачають наміри користувачів, замість занадто індивідуалізованих

NavBoost допомагає Google адаптувати видачу в режимі реального часу, роблячи її більш релевантною для користувачів і стійкою до спаму.

GWS – місце відображення результатів пошуку

Google GWS (веб-сервер) збирає і відображає результати пошуку, включно з органічними посиланнями, рекламою і додатковими блоками. Tangram (система, що відповідає за розрахунок: скільки місця або обчислювальних ресурсів потрібно для певних елементів) визначає, скільки місця потрібно кожному елементу видачі, а Glue (це інструмент, призначений для з’єднання різних компонентів в єдине ціле) – розміщує їх на сторінці. Однак система CookBook (система адаптації видачі до поточних призначених для користувача інтересів), включно з FreshnessNode (стежить за актуальністю контенту) і InstantNavBoost (змінює ранжування на основі поведінкових факторів користувача), може змінювати результати в реальному часі.
Наприклад, якщо виходить програма про Faber-Castell і міфи, що оточують слово «олівець», FreshnessNode помічає сплеск запитів про «олівець» і замінює транзакційні результати інформаційними. У такій ситуації наш документ, орієнтований на продажі, втрачає позицію в пошуку.
Це демонструє, що високі позиції залежать не лише від якісного контенту та SEO, а й від поведінки користувачів та нових сигналів. Система NavBoost може змінити ранжування, якщо інтереси користувачів змінюються.
SEO працює в складній екосистемі, де сигнали, як-от зворотні посилання або кліки, постійно перераховуються. Навіть тимчасове падіння позицій може бути пов’язане із зовнішніми факторами, а не помилками. Коли сплеск інтересу до теми вщухне, документ, ймовірно, повернеться на своє місце.
Щоб утриматися в топі, важливо зберігати високий CTR. Наприклад, для позиції 5 нормальний показник CTR – близько 4%. Це допомагає закріпити результат у довгостроковій перспективі.

Основні висновки для SEO оптимізації

Диверсифікація джерел трафіку: використовуйте не тільки пошукові системи, а й соцмережі, прямі URL та інші канали, оскільки Google враховує весь трафік.
Підвищення впізнаваності бренду і домену: працюйте над репутацією бренду, щоб збільшити CTR і поліпшити позиції в пошуку.
Розуміння намірів користувачів: аналізуйте шлях користувачів за допомогою інструментів (Semrush, SimilarWeb) і додавайте контент, якого бракує.
Оптимізація заголовків і описів: підвищуйте CTR за рахунок поліпшених заголовків і їх відповідності ключовим словам.
Аналіз прихованого контенту: уникайте акордеонів для важливої інформації, щоб не збільшувати показник відмов.
Видалення неефективних сторінок: прибирайте сторінки з низьким трафіком або поганими сигналами, щоб поліпшити кластер домену.
Поліпшення структури сторінок: створюйте зручну навігацію і чітку структуру для підвищення рейтингу.
Максимізація залученості: прагніть утримувати відвідувачів, надаючи вичерпну інформацію.
Розширення наявного контенту: поліпшення старих матеріалів може бути ефективнішим за створення нових.
Відповідність заголовків вмісту: переконайтеся, що заголовки чітко відображають текстові блоки.
Використання веб-аналітики: стежте за поведінкою користувачів, аналізуйте показник відмов і виправляйте недоліки.
Орієнтування на менш конкурентні ключові слова: Для початкового просування зосередьтеся на низькоконкурентних запитах.
Розвиток якісних зворотних посилань: Шукайте посилання з релевантних, популярних сторінок, уникайте токсичних посилань.
Контекст посилань: Переконайтеся, що оточення посилань природне і корисне.
Експертність авторів: Включайте контент від визнаних професіоналів для підвищення довіри.
Створення унікального і структурованого контенту: Ключові сторінки повинні демонструвати експертність і бути корисними для користувачів.

Зміст

Новий документ, що очікує на візит Google бота
Система індексації Google – Alexandria
Механізм пошуку та ранжування QBST
Первинний аналіз запиту
Зв’язування з індексом Google
Ранжування результатів
Обробка спеціальних запитів
Ascorer: Створення «зеленого кільця»
Superroot: Перетворити 1000 на 10
Як працюють Twiddlers?
Очінщики якості Google і RankLab
Як NavBoost допомагає ранжуванню
GWS — місце відображення результатів пошуку
Основні висновки для SEO оптимізації

Інші тематичні статті