Что такое кластеризация слов и зачем ее делать?
Кластеризация — это процесс создания групп запросов (кластеров), каждый из которых необходимо продвигать на соответствующей целевой странице. Кластеризация — очень важный базовый прием при продвижении любого сайта. Алгоритмы поисковых систем, которые применяются для ранжирования сайтов, зависят от типов запросов. Простой пример: коммерческие и некоммерческие запросы ранжируются по абсолютно разным правилам и их невозможно продвинуть на одной целевой странице. Если кластеризация не была проведена или была проведена неверно, вы можете до бесконечности продвигать свой сайт без видимых результатов по части поисковых запросов.
Кластеризация в PromoPult в модуле поискового продвижения работает по методу сравнения ТОПов в поисковых системах: запросы объединяются в группу, только если есть общий для всех запросов набор URL адресов. Также вы можете управлять точностью кластеризации — настраивать минимальное количество наборов URL адресов при котором запросы будут объединены в кластер.
Ниже мы подробно, на примере одного сайта, расскажем о необходимости кластеризации запросов и возможностях в PromoPult. Взгляните на пример небольшой части ядра, на первый взгляд, очень похожих запросов:
Ключевое слово | Частотность Wordstat Москва |
---|---|
параплан | 78944 |
полеты на параплане | 9337 |
купить параплан | 4627 |
мотопараплан | 3198 |
купить мотопараплан | 959 |
полетать на параплане | 353 |
полеты на мотопараплане | 297 |
подарок полет на параплане | 145 |
подарки параплан | 126 |
полеты на параплане в подмосковье | 85 |
купить полет на параплане | 77 |
подарочный сертификат на полет на параплане | 64 |
полеты на параплане с мотором | 50 |
параплан компромисс | 16 |
параплан этюд | 6 |
купить полет на мотопараплане | 2 |
подарочный сертификат на полет на мотопараплане | 1 |
параплан стимул | 0 |
Как кластеризует ядро специалист, если будет делать все «руками»?
Правильно — по смыслу запросов. Получится примерно вот такое распределение:
Название кластера | Ключевое слово | Частотность ключевых слов |
---|---|---|
параплан | параплан | 78944 |
параплан | купить параплан | 4627 |
полеты на параплане | полеты на параплане | 9337 |
полеты на параплане | полетать на параплане | 353 |
полеты на параплане | полеты на параплане в подмосковье | 85 |
мотопараплан | мотопараплан | 3198 |
мотопараплан | купить мотопараплан | 959 |
подарок полет на параплане | подарок полет на параплане | 145 |
подарок полет на параплане | подарки параплан | 126 |
подарок полет на параплане | подарочный сертификат на полет на параплане | 64 |
подарок полет на параплане | купить полет на параплане | 77 |
полеты на мотопараплане | полеты на мотопараплане | 297 |
полеты на мотопараплане | полеты на параплане с мотором | 50 |
полеты на мотопараплане | подарочный сертификат на полет на мотопараплане | 1 |
полеты на мотопараплане | купить полет на мотопараплане | 2 |
параплан компромисс | параплан компромисс | 16 |
параплан этюд | параплан этюд | 6 |
параплан стимул | параплан стимул | 0 |
А теперь давайте посмотрим на реальную выдачу «Яндекса» по этим словам и проверим, находятся ли в группе слов одинаковые сайты, что свидетельствует о потенциальной возможности продвигать один сайт по запросам из кластера.
Параплан | Купить параплан |
---|---|
Мы видим достаточно разнообразный набор сайтов, но два пересечения присутствуют. Обратите внимание, что остальные результаты выдачи — это разные по тематике, параметровым характеристикам, моделям представления информации сайты, что видно даже из их сниппетов. И здесь кроется первый подвох: если мы продвигаем сайт по продаже подарочных сертификатов на полеты на параплане, от запроса «параплан купить» вообще стоит отказаться.Вы попросту не продвинете его по данному запросу. Ну а если у вас сайт по продаже парапланерного оборудования, продвигать его по данным запросам можно, но делать это стоит на разных страницах, как у присутствующих в выдаче конкурентов.
А теперь давайте взглянем на поисковую выдачу по запросам, которые специалист определил в разные кластеры, например, «полеты на параплане» и «подарок полет на параплане». Это действительно разные по смыслу фразы, и специалист не совершил ошибку, определив их в разные кластеры.
Полеты на параплане | Подарок полет на параплане |
---|---|
Бинго! Абсолютно одинаковые сайты по модели представления информации, тематике и пр. Огромное количество пересечений между конкурентами, одинаковые посадочные страницы по обоим запросам в выдаче. Получается, что нам гораздо удобнее и правильнее продвигать единую страницу для этих запросов — это дешевле (контент нужно писать только на одну страницу, улучшать внешние факторы нужно будет только по одной странице и пр.) и эффективнее.
Давайте разбираться, как можно делать кластеризацию правильно и не ошибаться.
Предыстория
Выбор целевых страниц достаточно давно полностью автоматизирован. Для определения мы задаем искомый запрос в поисковой системе, ограничиваясь поиском по вашему сайту. Вот примеры запросов для определения релевантной страницы:
Такой метод позволяет найти релевантную, по мнению поисковой системы, страницу, но имеет ряд недостатков:
- Плохая точность, если на сайте мало страниц. Практически по всем запросам часто будет искаться главная страница, в итоге мы можем получить релевантную главную для запросов «окна», «двери», которые физически нельзя продвинуть на одной странице.
- Некорректная работа алгоритма, если не все страницы сайта проиндексированы / невозможная работа алгоритма, если сайта еще нет. Достаточно серьезное ограничение для новых проектов. Неправильно сделанное распределение запросов по страницам может погубить будущие результаты продвижения.
- Нет учета применяемого алгоритма ранжирования ПС для конкретного типа запроса. Метод не позволяет анализировать текущую картину, которая представлена в топах, поэтому мы не в состоянии увидеть правильной картины группировки слов.
Иными словами, для небольшого количества запросов, особенно кардинально разных по смыслу («паркет», «ламинат», «половая доска»), а также при учете хорошо структурированного и проиндексированного сайта данный метод может быть применим и сегодня, но когда речь идет о первичном продвижении, то нужно искать альтернативу.
Современные методы кластеризации
Сравнение страниц топов или hard-кластеризация
Лучший метод по всем показателям на данный момент. Кластеризация производится по методу сравнения топов в поисковых системах: запросы объединяются в группу, только если есть общий для всех запросов набор URL-адресов. Вы выбираете поисковую систему, на основе которой будет производиться кластеризация, а также необходимую точность, т. е. минимальное количество общих URL-адресов для слов, при котором слова будут объединены в группу. Сравнение производится по 10 результатам поисковой выдачи, соответственно, точность бывает от 1 до 10.
Сравнение через маркерные слова или soft-кластеризация
В этом методе кластеризации алгоритм определяет центральные (маркерные) запросы и сравнивает с ними все остальные запросы. Все остальные подвергают сравнению с маркерным словом по количеству общих URL в топ-10 «Яндекса». Soft-кластеризация формирует группы достаточно большого размера, но часто возникают ошибки в определении возможности совместного продвижения запросов на странице.
Для визуалов различие между этими видами кластеризации представим так:
Недостатки кластеризации по методам сравнения топов (hard)
- 1. Большие ресурсозатраты. Для того, чтобы произвести кластеризацию, необходимо собрать топ, отсеять нерелевантные вашему сайту результаты (например, присутствие почти по всем запросам Википедии ничего не даст коммерческому сайту, ее желательно исключить из сравнения). Если делать это вручную в Excel, кластеризация займет часы или дни работы. Поэтому подобный метод применяют, только используя автоматизированные инструменты.
- 2. Частая невозможность получения кластеров с адекватным количеством ключевых слов. Если ядро запросов состоит из достаточно похожих по смыслу слов, то порой при задании точности 3–5 (количество одинаковых URl, при которых запросы будут собраны в кластер) вы получаете 2–3 больших кластера с огромным количеством слов, что порождает сложности в проведении текстовой оптимизации, т. к. вы будете балансировать с оптимизацией на грани попадания под спам-фильтры поисковых систем.
- 3. Качество кластеризации полностью зависит от качества выдачи. Если вы продвигаете огромное количество НЧ и сверх НЧ запросов не в коммерческой выдаче, то вероятность наличия дорвеев, UGC-контента (форумы, гостевые и пр.) резко возрастает, соответственно, качество результатов кластеризации пропорционально снижается. Пользуйтесь лайфкахом: даже если вы планируете продвигаться в регионе, кластеризацию лучше делайте по Москве — качество сайтов там выше, и кластеризация получится лучше.
Как данные проблемы решены в PromoPult?
Вот результаты кластеризации нашего ядра (точность кластеризации 4, регион Москва):
Название кластера | Ключевое слово | Частотность ключевых слов |
---|---|---|
полеты на параплане | полеты на параплане | 9337 |
полеты на параплане | полетать на параплане | 353 |
полеты на параплане | подарок полет на параплане | 145 |
полеты на параплане | подарки параплан | 126 |
полеты на параплане | полеты на параплане в подмосковье | 85 |
полеты на параплане | купить полет на параплане | 77 |
полеты на параплане | подарочный сертификат на полет на параплане | 64 |
полеты на мотопараплане | полеты на мотопараплане | 297 |
полеты на мотопараплане | полеты на параплане с мотором | 50 |
мотопараплан | мотопараплан | 3198 |
мотопараплан | купить мотопараплан | 959 |
параплан | параплан | 78944 |
параплан компромисс | параплан компромисс | 16 |
параплан этюд | параплан этюд | 6 |
купить полет на мотопараплане | купить полет на мотопараплане | 2 |
купить параплан | купить параплан | 4627 |
подарочный сертификат на полет на мотопараплане | подарочный сертификат на полет на мотопараплане | 1 |
параплан стимул | параплан стимул | 0 |
Описанная проблема при ручной кластеризации с необходимостью продвижения слов «параплан» и «купить параплан» на разных страницах сайта решена автоматически — слова определены в разные кластеры.
Фразы «полеты на параплане» и неподходящие по смыслу «подарочный сертификат на полет на параплане» также отнесены к единому кластеру, т. к. имеют одинаковый набор продвигаемых страниц у конкурентов. Данная проблема, описанная в блоке, также решена автоматически.
Из необычного. Давайте посмотрим за запросы «полеты на мотопараплане» и «подарочный сертификат на полет на мотопараплане». На первый взгляд кажется, что данная конструкция очень похожа на пример выше, и слова должны быть определены в один кластер, но система не сделала этого.
Полеты на мотопараплане | Подарочный сертификат на полет на мотопараплане |
---|---|
Однако мы видим, что это неверное предположение! Ранжирование по этим запросам в «Яндексе» устроено несколько иначе. По запросу «полеты на мотопараплане» присутствуют абсолютно другие типы сайтов, и пересечения с запросом «подарочный сертификат на полет на мотопараплане» практически нет. Заметить это при работе вручную сложно, но если вы используете автоматизацию и работаете в сервисе, вы не ошибетесь!