Доброго времени суток!

Кластеризация запросов — это разбиение их на группы. Группы запросов объединяются каким либо признаком. По сути это классификация запросов.

В качестве признака берем логическую принадлежность к одной или другой странице.

Сбор семантического ядра и кластеризация это фундамент и пол вашего SEO жилища. Если Вы сделали хорошее ядро, но не верно распределили его по страницам своего будущего сайта, не верно наметили структуру — эффективность продвижения будет крайне мала.

Пример кластеризации запросов

Возьмем 5 запросов в произвольном порядке:

  • торт белочка рецепт с фото
  • торт белочка рецепт с фото пошагово
  • бизе рецепт фото торт
  • как приготовить торт бизе
  • бисквитный торт рецепт

Сегодня у нас сладкая тематика в преддверии праздника.

В данной группе запросов все достаточно просто с логической точки зрения. Получаем 3 группы

торт белочка рецепт с фото 152 торт белоч елочка
торт белочка рецепт с фото пошагово 96 торт белоч елочка
бизе рецепт фото торт 24 торт бизе
как приготовить торт бизе 22 торт бизе
бисквитный торт рецепт 18772 торт бисквит

Соответственно получается 3 кластера запросов под 3 продвигаемые страницы.

А что делать если запросов много?

С малым количеством запросов все понятно.  Их не сложно разбить на группы используя excel или любую другую программу для работы с электронными таблицами.

А как же разбить большое количество запросов? Когда их 100, 1000 или 10 000?

Обращаемся все к тем же таблицам и одной полезной программе  n-gramm tools.

[sociallocker]Ссылка на скачивание: http://homepages.inf.ed.ac.uk/lzhang10/ngram.html[/sociallocker]

Данная программа позволяет разбивать произвольный текст на n-граммы, на 100 граммы в том числе. Нас больше интересуют  униграммы — одно словники.

Возьмем произвольный список запросов (около 4000):

 

Кластеризация большого списка запросов

Они имеют разные признаки, чтобы собрать эти признаки в 1 список воспользуемся программой и  разобьем все запросы на униграммы.

Как разбить запросы на униграммы с помощью n-gramm tools

  • Скачиваем программу по ссылке выше или находим ее в  google
  • Скидываем в диск C:/1 или другое произвольное место, но лучше по короче
  • Жмем Пуск-> выполнить и вводим cmd
  • Открывается командная строка
  • С помощью команды «Cd: C:/1/» переходим в нужный каталог.
  • Предварительно в папке создаем текстовый файл с именем keys.txt в UTF-8  без BOM кодировке (notepad++ в помощь).
  • Вводим команду «text2ngram -n1 key.txt > 1-gramm.txt»
  • Полученный результат сохраняется в файле 1-gramm.txt.

Это видео кратко иллюстрирует процесс:

Как использовать униграммы в кластеризации запросов?

Готовый список униграмм надо почистить:

  • убрать предлоги и слова которые не нужны при формировании групп
  • слова с разными словоформами удалить оставив общую часть слова (например корень или несклоняемую часть)
  • как то пометить синонимы, чтобы потом было легко их объединить в одну группу

Униграммы

Получится список слов и количество их упоминаний в общем массиве ключей.

Следует разделить  данные слова-признаки  логически  в группы и разместить каждую группу над столбиком напротив ключевых запросов.

Униграммы разделенные по признакам

После этого следует используя инструмент «Условное форматирование» проставить напротив ключевых запросов каждый из признаков.

Результат данной работы

Итог кластеризации

Как превратить файл с ключами и сортировкой в конечный продукт?

Используя инструмент «Сцепить» объедением все характеристики в одну строку:

Готовые группы запросов

Готовые группы следует проверить и назначить им продвигаемую страницу.

В идеале следует составить mind map структуры будущего сайта  или текущего продвигаемого.

Пример структуры сайта в  mind map

структуры для сайта одежды

Теперь ваше семантическое ядро разбито на кластеры и каждому кластеру назначена страница. Схематическая структура позволит быстрее создать нужные страницы сайта. А файл оставшийся после кластеризации пригодится в формировании технического задания для копирайтера и вебмастера.

Автоматическая кластеризация запросов

  • По целевому ТОП Поисковых систем
  • Автоматизация описанного алгоритма
  • Лемматизация

Кластеризация с помощью поисковых систем

Данный вид кластеризации осуществляется с помощью анализа целевого ТОП по запросам семантического ядра и группировке этих запросов с помощью результатов этого анализа. Как правило группируются запросы находящиеся на одной странице у одного и более конкурентов.

Пример работы можно поглядеть на SEOINSANE.

Кластеризация посредством лемматизации

В данном процессе используется разбивка на  n-gramm, морфологический анализ слова и объединение запросов в группы используя все эти данные.

Можно ли автоматизировать алгоритм описанный в статье?

Да я это сделал. Скрипт предоставляется только на платной основе, хоть и является не особо сложным в реализации. Пример его работы можно посмотреть по ссылке:

[sociallocker]Для корректного отображения скачайте файл и воспроизведите на компьютере https://yadi.sk/i/2CR-XeoMdQv2a[/sociallocker]

Кроме того прилагаю пример кластеризации запросов описанный в этой статье:

[sociallocker]Ссылка для скачивания: https://yadi.sk/d/b0azkDCZdeeb9[/sociallocker]

Спасибо за внимание, надеюсь данная информация была полезна.