Создание групп в компании по ключевым запросам. Как собрать и разгруппировать семантическое ядро: полная инструкция. Анализ групп в программе Key Collector

Автор : Алексей Чекушин - SEO-Эксперт Kokoc.com (Kokoc Group), создатель сервиса Just-Magic.org

В своей предыдущей статье: « » я назвал кластеризацию одним из основополагающих факторов успеха в продвижении. В этой публикации я подробно разбираю, что такое кластеризация, и как правильно применять её.

Что такое кластеризация?

Это автоматическое объединение запросов в группы, которое решает две важные задачи:

  1. Объединение похожих запросов (с одинаковым «интентом») вне зависимости от их семантической схожести. («интент» = намерение пользователя). Например, запросы «снять квартиру» и «аренда квартир» - выражают одно и то же желание пользователя.
  2. Проверка совместимости продвигаемых запросов: можно ли их продвинуть на одной странице в топ Яндекса одновременно . Т.е. возможно ли подстроить оптимизацию страницы под все эти запросы. Или же какие-то запросы требуют выноса на отдельную страницу.

Из всех существующих сегодня методов наиболее эффективно эти задачи решает, так называемая, «кластеризация по топам », когда запросы сравниваются по количеству одинаковых URL-ов в топ-10 Яндекса.

Теперь поговорим о каждом пункте подробнее.

Объединение запросов с одинаковым интентом

Что такое запросы с одинаковым интентом ? Это разные запросы, в которых человек, на самом деле, ищет одно и то же. Очевидно, что запросы «телевизоры самсунг » и «телевизоры samsung » должны продвигаться на одной странице. Но это - явные вещи.

Однако существуют и куда менее очевидные примеры:

  • «спецодежда» - «рабочая одежда»
  • «ипотека» - «кредит под залог квартиры»
  • «автоломбард» - «кредит под залог авто»

Семантически эти пары совсем не похожи, но фактически обозначают одно и то же. Классические способы поиска таких запросов, обладающих единым интентом (намерением пользователя), основываются на синонимах. Как правило, с этой целью используют словари синонимов или синонимы Яндекса . Однако в обоих методах есть свои серьезные минусы.

Если мы будем пользоваться словарями синонимов, то найдем там весьма странные связи. Например, согласно одному из самых популярных словарей, синонимом к «мобильный телефон» являются:

  • мобила
  • мобильник
  • радиотелефон
  • сотовик
  • сотовый телефон
  • телефон
  • эбонитовый друг

Сотовый телефон - однозначно полезный синоним. А вот «радиотелефон» - совершенно другой тип товара. Ну а кто такой «эбонитовый друг», остается только догадываться.

Второй вариант поиска синонимов - попытаться «выцепить» их из подсветок Яндекса. Но это сопряжено с двумя проблемами:

Во-первых, подсвечиваются не только синонимы, но и другие слова. Например, в подсветку по ключевой фразе «сотовые телефоны» попадает не только синоним «мобильные», но и: «цены», «москва», «купить», «каталог», которые подсвечиваются по другим причинам. В целом, это проблема решаемая, обходные пути есть.

Во-вторых, синонимы в Яндексе являются невзаимными . Например, вхождение «мобильные телефоны» является синонимом к запросу «сотовые телефоны», а в обратном порядке это уже не работает. «Сотовые телефоны» не будет синонимом к «мобильные телефоны», и этот момент становится критически важным. Как понять, что запрос «сотовые телефоны» соотносится с запросом «мобильные телефоны», если слово «сотовые» по нему не подсвечивается?

Наконец, как вы поймете, что запросы «ювелирный магазин», «ювелирные изделия» и «ювелирные украшения» обладают одним интентом, если, с точки зрения Яндекса, они не являются синонимами?

Решение проблемы приходит через кластеризацию запросов по топам. Нахождение в топе одинаковых URL-ов сигнализирует об одинаковом интенте. Вот пример работы кластеризатора just-magic:

Вроде бы, кластеризатор все правильно объединил: «мобильные телефоны» положил в одну группу с «сотовыми», а «ювелирные изделия» — в группу, где присутствует «ювелирный магазин». Почему же тогда «ювелирные украшения» попали в отдельную группу, несмотря на то, что тематика здесь та же (это видно по столбцу «spec-grp»)?

Ответ на этот вопрос приводим в следующей части статьи.

Проверка совместимости продвигаемых запросов

Для продвижения нам не просто нужно собрать на странице похожие запросы, необходимо еще и проверить их совместимость.

В Яндексе нет единой формулы ранжирования под все запросы. Запросы делятся на большое количество типов. И формулы для разных типов запросов часто предъявляют к странице взаимоисключающие требования для попадания в топ. Причем часто визуально эти запросы очень похожи. Например, запросы «смартфон» и «смартфоны». Первый — некоммерческий, геонезависимый. Второй - коммерческий геозависимый. Как видно, в данном случае единственное и множественное число - несовместимы на одной странице!

Если вы вдруг подумали что это логично, то вот другой пример: запросы «ноутбук» и «ноутбуки». Они оба коммерческие и геозависимые и прекрасно совмещаются на одной странице.

Коммерческость и геозависимость - лишь два самых очевидных признака. На самом деле, их намного больше. Например, главную или внутреннюю страницу поиск хочет видеть в топе по запросу. Когда мы не знаем всего многообразия признаков, единственный способ определить возможность совместного продвижения запросов на странице - это посмотреть, есть ли URL-ы, которые одновременно показываются по двум запросам, и подсчитать, сколько их.

Логика здесь следующая:

  • Если по запросам в топе находятся одинаковые URL-ы, значит их можно продвинуть на одной странице.
  • Если по запросам общих URL-ов нет, то мы не знаем, возможно ли продвинуть запросы на одной странице. Скорее всего, это невозможно.

И здесь мы сталкиваемся с вопросом: как именно объединять запросы на основании топов? Я различаю два метода - так называемые, «soft» и «hard» кластеризации.

Следующая картинка наглядно объясняет разницу между ними:

Soft-кластеризация сводится к следующему: для формирования группы берется один «центральный» запрос и все остальные сравниваются с ним по количеству общих URL-ов в топ-10 Яндекса. Если количество общих URL-ов превышает порог - запрос добавляют в группу.

При hard-кластеризации запросы объединяют в группу, только если есть общий для всех запросов набор URL-ов, который показывается по всем этим запросам в топ-10.

Soft-кластеризация дает группы бὸльшего размера, но часто ошибается в определении возможности совместного продвижения запросов на странице.

Классический пример : представим себе, что в качестве «центрального» был выбран запрос, по которому в топе 5 главных и 5 внутренних страниц. К нему могут оказаться привязаны два запроса, у одного из которых в топе 10 «морд», у другого - 10 «внутряков». Очевидно, что из этих трех запросов мы можем продвинуть только два (в зависимости от типа страницы, который выберем - главная или внутренняя). В случае hard-кластеризации появление такой группы невозможно.

Но это все лирика. Перейдем к численным оценкам.

Итак, у нас есть два критерия оценки кластеризации:

  1. Насколько полно собрана группа запросов. То есть, попали ли в неё все запросы, имеющие один и тот же «интент». За 100% возьмем ситуацию, когда все запросы с одним интентом - попали.
  2. Насколько попавшие в группу запросы совместимы между собой. За 100% возьмем ситуацию, когда все попавшие в кластер запросы совместимы между собой.

Ключевой параметр кластеризации - минимальное количество общих URL-ов для образования группы. Это число называют «порогом кластеризации ». Чем он выше - тем точнее получаемые группы, но при этом они закономерно уменьшаются в размерах. Экспериментальным путем было определено, что минимальный рабочий порог для «hard»-кластеризации - 3 URL-а, для «soft» - 4 URL-а. Работать с меньшим числом - нет смысла: слишком много «левых» запросов попадает в группы.

Вот пример результатов для разных порогов для hard-кластеризации:

Используя сервис just-magic.org , мы провели сравнение двух методов кластеризаций на выборках из разных тематик. Ниже представлен сводный график:

Сравнения проводилось для методов «soft» и «hard». Для числа пересекающихся URL-ов от 3-х до 6-ти (это минимальное число общих URL-ов для формирования кластера).

Как видно из графика, hard-кластеризация показывает очень высокую точность уже при пороге в 3 URL-а - 92%. Чтобы читатели статьи понимали, насколько это большая цифра, приведу пример: в исполнении опытного оптимизатора без инструментов точность будет составлять порядка 70%, а если за работу возьмется неопытный специалист, точность не будет превышать 30%. При этом, однако, полнота получается достаточно низкая - всего 40%. Но, опять же, смотря, с чем сравнивать. «Руками» оптимизаторы набирают максимум 20%.

Soft-кластеризация демонстрирует очень хорошие показатели полноты, но точность - «хромает на обе ноги». Приемлемые для продвижение значения получаются только на пороге «5», но при этом полнота падает до 23%.

Означает ли это, что данный метод неприменим? Нет. Все зависит от вашей задачи. Если вы занимаетесь «трафиковым» продвижением, и вам важно вывести на странице как можно больше запросов - неважно каких, то вам подойдет soft-кластеризация. Именно поэтому, когда в январе этого года в сервисе just-magic.org появилась hard-кластеризация, для модуля «маркеры» был сохранен «soft»-режим.

Если же вам важно вывести на странице определенный набор запросов, то ваш выбор однозначен - только hard-кластеризация, только хардкор. Еще один плюс hard-кластеризации состоит в том, что получаемые группы - однозначны. То есть, запросы, оказавшиеся в одной группе по 4 URL-ам, не могут оказаться в разных группах по 3 URL-ам (при использовании soft-кластеризации, такое запросто может быть). Поэтому кластеризатор Just-Magic отображает группы сразу по 3,4,5 и 6 URL-ам.

Стоит отдельно отметить, что если мы хотим в дальнейшем проводить текстовый анализ страницы, то допустимо использовать только hard-кластеризацию. Дело в том, что любой текстовый анализ по группе запросов для страницы очень строго соотносится с качеством этой группы. Только hard-кластеризация обеспечивает группы нужного качества.

Подведем итоги

Итак, какие бонусы дает кластеризация?

Во-первых, это ускорение процесса разбора больших ядер. Раньше на это уходили недели и месяцы работы. С помощью кластеризатора оптимизатор делает это за пару часов.

Во-вторых, это возможность распределить запросы по страницам таким образом, чтобы их было возможно одновременно продвинуть. «Ручной» альтернативы кластеризации здесь нет - даже опытный оптимизатор совершает до 30% ошибочных распределений, если действует «на глазок».

Исходя из второго пункта, становится понятно, что кластеризацию при продвижении нужно использовать всегда . Даже если ядро меньше 100 запросов, сделать правильно распределение запросов по страницам «на глазок» вы не сможете. Исключением могут стать только тематики со сверхнизкой конкуренцией, где кластеризация по топам перестает работать из-за отсутствия в топах релевантных ответов.

Если вы занимаетесь «трафиковым» продвижением, то можете пользоваться как «soft», так и «hard» методами кластеризации. Если же осуществляете «позиционное» продвижение, когда важно вывести в топ все запросы, то подойдёт только метод «hard». Также, с совместим только «hard»-режим.

Используйте кластеризацию в своей работе, и вы обретете счастье и гармонию, а продвигаемые вами запросы гарантированно попадут в топ!

Это только начало работы. Без кластеризации собранные данные хоть и будут полезны, но не смогут раскрыть весь свой потенциал. Под кластеризацией семантического ядра понимают группировку поисковых запросов после анализа выдачи поисковиков. Процесс достаточно трудоемкий (если делать вручную, подробнее я расскажу ниже), но совершенно необходимый для большинства ресурсов.

Для многих сайтов важно отделить информационные запросы от коммерческих. Например, запросы вида «название товара» и «купить название товара» всегда будут иметь разную поисковую выдачу, так как первый - информационный, а второй - коммерческий. С практической точки зрения это означает то, что продвинуть их на одной странице будет крайне сложной задачей, поэтому их и группируют, после чего делают несколько страниц под каждый кластер.

Выше я указал довольно простой пример, любой человек без особых знаний сможет отделить запросы со словом «купить» от всех остальных, не заглядывая в поисковую выдачу, но на практике часто попадаются более сложные варианты, где необходима полноценная кластеризация с анализом поисковой выдачи.

Если говорить по пунктам, то кластеризация семантического ядра нужна для:

  • эффективного продвижения всех поисковых запросов;
  • составления правильных ТЗ для копирайтеров (об этом я еще расскажу ниже);
  • экономии средств. При хорошей кластеризации и качественном контенте большинство запросов займут топ без дополнительных движений со стороны оптимизатора (покупка ссылок и т.д.).

Отмечу, что есть разные типы семантических ядер, кластеризация необходима только для контентного плана, а вот для снятия позиций или для контекстной рекламы это не требуется.

Ручная кластеризация семантического ядра

Здесь вам поможет обыкновенный Excel, в котором вам необходимо группировать ключевые фразы . В некоторых случаях от вас даже не потребуется изучать поисковую выдачу, все запросы можно распределить по кластерам без каких-либо затруднений. Стоит упомянуть и онлайн-сервисы, которые облегчают подобную работу.

Пример группировки ключевых слов, здесь:

  • В первом столбце - порядковый номер группы;
  • Во втором - ключевое слово;
  • В третье - частотность;
  • В четвертом - суммарная частотность группы (важно для расстановки приоритетов)
  • В пятом - количество слов в группе.

Kg.ppc-panel.ru

Я не стал рассказывать о других сервисах, их на самом деле много. Подобные инструменты сегодня внедряют многие, ну а какой выбрать - личное дело каждого. Я предпочитаю пользоваться узкоспециализированными продуктами, поэтому мне удобнее работать с KeyAssort. Но кому-то больше подойдет сервис, который еще и проверит позиции, соберет ключи и т.д.

Если у вас большой проект, в котором очень много ключевых фраз, то делать его без кластеризации семантического ядра будет очень большой ошибкой. Просто потому, что ваши конкуренты обязательно сделают это. Кроме того, если у вас уже есть работающий сайт, для него все равно можно сделать кластеризацию. Это поможет выявить ключевые слова, которые вы пропустили, и пересмотреть качество контента. Иногда достаточно просто написать одну статью или создать отдельный раздел, а не покупать ссылки, пытаясь продвинуть поисковый запрос, который оказался в неудачном кластере.

Привет, дорогие друзья! С наступившим Новым Годом вас, надеюсь, вы уже отошли от праздников и настроились на боевой лад. У меня для вас новогодний подарок сегодня — очень крутой практический пост. Пост не мой, но более чем достоин появиться на страницах этого блога.

Обзор составлен крутым чуваком по имени Дмитрий Мирошниченко. Дима живет в Волгограде, работает руководителем проектов в местной веб-студии, которая занимается развитием и продвижением собственных проектов. А еще Дима — кандидат наук, а это вам не хухры-мухры!

Всё что написано ниже является моей точкой зрения и основано на моём жизненном опыте. Я не претендую на истину в последней инстанции. Если вы видите какие-то процессы иначе и знаете, как можно решить поставленную задачу эффективнее, крайне желательно не сдерживать себя и написать об этом в комментарии.

Итак, задача: составить семантическое ядро для сайта. Что означает слово «семантическое»? Вот что нам сообщает Википедия. Сема́нтика (от др. -греч. σημαντικός - обозначающий) - раздел лингвистики (в частности, семиотики), изучающий смысловое значение единиц языка. То есть нам нужно выделить смысловые направления для структуры сайта.

Как обычно решается эта задача?

  1. Парсим запросы (вордстат , различные базы, подсказки, сервисы типа спайвордс и семраш , открытые счётчики статистики и другие источники)
  2. Отсеиваем мусор и проверяем частотность
  3. Распределяем запросы на группы
  4. На основе групп делаем структуру сайта и распределяем статьи

Первые два пункта успешно решаем с помощью кейколлектора . Тут особых мук выбора не возникает. Кейколлектор действительно удобный инструмент.

Третья задача самая интересная. Её решение мы и будем рассматривать.

Четвёртая задача решается достаточно тривиально, если третья была качественно реализована.

Исходные данные

Информационный сайт дачной тематики. Раздел «кустарники и деревья». Всего было собрано 562 ключа. Это тренировочный набор данных. Мне было важно сравнить результаты работы разных инструментов.

Для раздела информационного сайта были собраны запросы, убран мусор и расставлена частотность «!» по вордстату больше 30. Нужно их распределить по группам.

Распределять запросы можно вручную и автоматом. Вручную распределяем по смыслу. Тут всё понятно. Для автоматической кластеризации есть много способов. Более подробно рассмотрим для каждого инструмента.

Инструменты, облегчающие ручную кластеризацию запросов

Excel, LibreOffice, OpenOffice

Думаю, тут нет смысла подробно описывать, как работать с этими инструментами.

Достоинства

  • высокая точность обработки — руками всё-таки обрабатываем
  • универсальность — можно учитывать кучу параметров
  • в случае с LibreOffice, OpenOffice — бесплатные

Недостатки

  • в случае с Excel — платный
  • низкая скорость работы — при работе с большими объёмами данных
  • нужно делать бекапы

Google документы

Достоинства

  • аналогично предыдущему пункту
  • онлайн сервис — удобный доступ к документу
  • не нужно делать бекапы
  • бесплатный

Недостатки

  • скорость работы всё также низкая

kg.ppc-panel.ru

Онлайн сервис. Загружаешь запросы, фильтруешь, выделяешь группы.

Работает быстро. Функционал достаточный (кроме сохранения проектов), хороший интерфейс.

Достоинства

  • удобный интерфейс
  • быстро работает
  • наглядность
  • не нужно регистрироваться
  • бесплатный
  • онлайн сервис

Недостатки

  • нельзя сохранять проекты можно, только выгружать уже готовые
  • вытекает из предыдущего — если сервис заглючит, то потеряются все наработки
  • нельзя загружать частотности

Keyword Assistant — cоздание структуры будущего сайта

Ещё один онлайн сервис. Аналогичен предыдущему. Уже можно сохранять проекты.

Достоинства

  • проекты сохраняются
  • хороший и понятный интерфейс
  • можно загружать частотности
  • бесплатный
  • онлайн сервис

Недостатки

  • скорость работы повыше, чем при работе с excel, но всё равно сопоставимая
  • для параноиков — непонятно где хранятся ваши данные

Инструменты для автоматической кластеризации запросов

Группировщик ключевых слов для PPC

Десктопная версия со странной логикой поведения. Подробности по ссылке выше (где скачать, можно найти там же).

Краткое описание работы алгоритма кластеризации:

У нас есть некий набор ключевых слов. Перед составлением индекса, скрипт нормализует все словоформы. На следующем этапе скрипт группировки определяет частоты для всего индекса документа и выстраивает рейтинг. Частоты считаются для каждого слова (после нормализации). Если у нас есть «отдых в тунисе» то скрипт считает частоты для «отдых» и «тунис».

На данном этапе – рейтинг слов выстраивается от наиболее частотных к менее частотным. Зачем это нужно? Чтобы создать основные группы. Скажем так, если слово «египет» встречается чаще чем слово «отель» то поисковый запрос (например, [недорогие отели египта]) включающий слово «отель» будет отнесен к группе «египет» а не наоборот.

Итак, мы сгруппировали слова, но довольно примитивно. Далее – нам нужна более точная группировка.

Более точная группировка означает, что внутри каждой группы скрипт создаст подгруппы и распределит слова между ними.
На данном этапе точно также будет выстраиваться рейтинг слов по частоте. При этом рейтинг будет создаваться только внутри группы, основное слово группы (оно же – название группы) не будет принимать участие в рейтинге. Кроме того, рейтинг слов в группе выстраивается по обратной частотности. Т.е. слово с наименьшей частотностью – первым создаст «свою» подгруппу.

Конечно, создать свои подгруппы могут только те слова, которые встречаются не менее N-раз (задается в настройках скрипта, но обычно это не менее 4-5).

Именно такой подход работает очень эффективно, когда основные группы создаются на основе рейтинга от наиболее частотных слов к наименее частотным, а подгруппы – от наименее частотных к наиболее частотным.

На выходе получаем сгруппированный список.

Достоинства

  • пока бесплатный
  • быстро работает

Недостатки

  • десктопная версия
  • как-то криво сохраняется проект
  • как там удалить что-нибудь?
  • крайне странная логика поведения, откуда в системе слова которых там не было? (видно на скрине)
  • алгоритм не учитывает смысла слов, только общий корень — самый существенный недостаток
  • заявлено огранивение в 1000 ключей
  • нельзя загрузить частотность
  • нужно делать бекапы

Rush Analytics

Онлайн сервис кластеризации запросов на основе выдачи ПС. Точнее кластеризация это только одна из возможностей сервиса. Более подробное описание доступно на сайте.

Кратко об алгоритме работы:

Кластеризация – это автоматическая разбивка ключевых слов на группы.
Как работает технология?
Вы загружаете список ключевых слов, выбираете тип кластеризации – система анализирует ранжирование поисковых систем и с помощью нашего алгоритма разбивает ключевые слова на группы, которые будут отлично ранжироваться в поисковых системах. На выходе Вы получаете ключевые слова разбитые на группы.

Можно выставить силу группировки. Выставляется видимо в попугаях. На выходе excel файлики с выбранной силой группировки. На первой вкладке кластеры. На второй всё, что осталось без кластеров.

Плата снимается только для сгруппированных запросов (максимальное количество).

Напомню, всего 562 запроса. Сколько запросов сгруппировалось для каждого варианта видно в таблице ниже.

Получаем максимальное число сгруппированных запросов 359. Неплохо для автомата. Сколько это стоило?

Получаем, что кластеризация 359 запросов обошлась в 552,5 рубля или чуть больше 1,5 рублей за зарос (хотя цифра группировки за запрос мне совершенно не интересна, но для общей картины пусть будет). Тут нужно уточнить, что кластером считается более двух запросов. Сколько групп получилось так и не придумал, как посчитать.

Теперь посмотрим что там по качеству.

Выберем тестовую группу по черешне. Вот список исходных запросов:

как правильно обрезать черешню валерий чкалов черешня черешня бычье сердце черешня дерево черешневый сад черешня ипуть обрезка молодой черешни обрезка черешни черешня сорта сорта черешни

Получилось два кластера для силы группировки 4 и 5:

Для силы группировки 3, кластер обрезки немного расширен:

Очевидно, что результат так себе.

Если бы я делал вручную, то кластер по сортам выглядел бы примерно так:

черешня бычье сердце черешня ипуть валерий чкалов черешня черешня сорта сорта черешни

Так что алгоритмы явно нужно допиливать.

Достоинства

  • онлайн сервис
  • все проекты сохраняются
  • при регистрации выдают 3000 рублей на счёт (на момент публикации, по моему уже прикрыли такую халяву)
  • худо бедно, но учитывается смысл (а не только общий корень) на основе выдачи поисковиков

Недостатки

  • пока в стадии тестирования (на момент публикации уже вроде нет)
  • платный
  • дорого — хорошо если ядро 500 запросов, а если тысячи и сотни тысяч?
  • всё равно нужно доделывать руками, полного автомата не получается

SEMparser — Структуризация семантики для SEO и контекста

Ещё один онлайн кластеризатор на основе выдачи поисковика.

Как работает (взято с сайта):

Как выглядит внутри:

После автоматической кластеризации появляется окно редактирования, где можно подправить ошибки.

Скачивается excel файлик. На первой вкладке запросы и группы с подробностями.

На второй вкладке только группы.

На третьей вкладке какой-то топ тематики.

Так же можно установить силу группировки. Потестил теже цифры: 3, 4 и 5.

Тут нужно уточнить, что кластер из одного запроса это тоже кластер. И он учитывается. Так что формально получается, что сгруппировалось 100% запросов. А вот сколько получилось групп с запросами 2 и более я тоже не придумал как посчитать.

Так же нужно учитывать, что ценообразование немного другое. Деньги снимаются за все запросы, которые есть в документе. Я купил 600 запросов, что обошлось мне в 288 рублей. Получаем стоимость одного запроса 0,48 копеек. После группировки у меня в системе осталось 38 запросов. В итоге группировка тестовой выборки ключей обошлась в примерно в 270 рублей. Что в два раза ниже, чем в предыдущем сервисе.

Посмотрим, что тут с качеством.

Для всех сил группировки получилось — 4 группы:

валерий чкалов черешня (1/170) валерий чкалов черешня (170) черешня ипуть (5/472) черешня ипуть (159) сорта черешни (134) черешня сорта (92) черешня дерево (44) черешневый сад (43) черешня бычье сердце (1/64) черешня бычье сердце (64) обрезка черешни (3/352) обрезка черешни (226) как правильно обрезать черешню (86) обрезка молодой черешни (40)

Тоже видим, что по смыслу не идеально. Нужно дорабатывать руками.

Достоинства

  • онлайн сервис
  • все проекты сохраняются
  • 50 запросов для теста при регистрации
  • худо бедно учитывает смысл
  • дешевле, чем предыдущий вариант

Недостатки

  • платный
  • алгоритм работает не идеально, нужна ручная коррекция

Just Magic — автоматический подбор семантики для SEO и контекстной рекламы

Интересный сервис на мой взгляд. Дизайн сайта: привет консоль.

Что у них заявлено на сайте:

— Собирать семантику для существующих страниц сайта, сразу правильно привязывая запросы к ним.
— Расширять существующую структуру сайта.
— Предлагать тематическую семантику для новых страниц сайта на основании текущего СЯ.
— Создавать семантику для проектируемого сайта.
— И просто кластеризовать запросы. Включая тематическое разбиение.

Можно посмотреть доклад разработчика на ТопЭксперте:

Вот что мне ответили разработчики про то, как там всё устроено:

Мы решаем сугубо утилитарную задачу — определить какие запросы могут продвигаться на одной странице.

Отсюда и метод решения — мы собираем выдачу ПС по каждому запросу и кластеризацию проводим на ее основании.

Фактически, нам необходимо решить достаточно простую задачу — раскидать запросы по совпадению URL в выдаче, попутно позаботившись, чтобы в один кластер не попали принципиально разные типы запросов. Типы мы выделяем такие:
— Коммерческий/информационный.
— «На морду»/"на внутряк".
— Однословный/2+ словный.
— С маркерами типа контента/без них.

«Маркеры типа контента» — это слова запроса, которые ПС использует для выставления требований к контенту на продвигаемой странице. Например — («отзывы», «видео», «скачать», «фото»).

Поскольку задача определена и набор входных данных довольно прост, то и алгоритм не замысловат. В основном алгоритме системы машинное обучение не используется. Центроиды в текущем алгоритме мы де-факто используем (один из запросов является «центром» кластера, а остальные должны иметь определенную меру схожести с ним). Сейчас используется «жадный» алгоритм их (центров) выделения. Но в этом методе есть определенные недостатки, поэтому в следующей версии алгоритма, которая сейчас внедряется, мы в принципе откажемся от понятия запроса-центра кластера.

Машинное обучение мы тоже используем, но в другом месте — автоматическая генерация запросов-маркеров на основании данных Яндекс.Метрики.

Пока попробовать не удалось. Отправил запрос на тестовый доступ. Сказали у них обновление. Основной функционал стоимостью от 30 000 руб/месяц будет доступен в конце января. Для простых смертных с объёмами поменьше в феврале.

Если всё будет работать, как заявляют, то будет очень круто. Посмотрим.

Достоинства

  • хорошие перспективы
  • онлайн сервис

Недостатки

  • пока нет версии для простых смертных, только месячная подписка
  • попробовать так и не удалось
  • как есть — дорого

SEO intellect — Сервис автоматизации SEO работ

Ещё один онлайн сервис по кластеризации. Заявленный функционал:

Сервис автоматизации SEO работ
● кластеризация запросов
● подбор посадочных страниц
● поиск конкурентов
● помощь в оптимизации контента
● заказ оптимизированных текстов

Мне так и не удалось его заставить работать. Нет никакой справки, никаких подсказок...

Достоинства

  • онлайн

Недостатки

  • так и понял как с ним работать
  • платный

Coolakov.ru — Разбивка ключевых запросов

Описание на сайте:

Сервис позволяет автоматически группировать уже собранные запросы. Разбивка запросов на группы производится на основе схожести топ10 Яндекса.

Про особенности алгоритма ничего найти не удалось.

Для моих 562 запросов получилось 305 групп. В группе минимум один запрос. Посмотрим что там с нашей черешней:

Видно, что группы 73 и 189 можно было бы и объединить… Ну и в остальном тоже понятно. Кластеризация, мягко говоря, не идеальная.

Достоинства

  • онлайн сервис
  • бесплатный

Недостатки

  • Как это скачать? Нет никаких кнопок, чтобы скачать. Можно только скопировать текст.
  • Без регистрации можно работать только с 20-00 до 7-00 по Москве. Зарегистрироваться никак нельзя. Вообще.

s:toolz — профессиональный инструмент кластеризации запросов на основе поисковой выдачи

Очередной сервис кластеризации. Особенность в том, что работает не в автоматическом режиме. Это же его и недостаток.

Порядок работы

Заявленный функционал:

Сервис кластеризации запросов предназначен для быстрой автоматизированной группировки больших списков запросов (ключевых слов для продвижения) в кластеры, которые формируются исходя из выдачи поисковых систем и представлений поисковой системы Яндекс о потребности пользователя.

Запросы из одного кластера необходимо продвигать на 1 страницу.

Отправил бриф. Ответили через два дня. Оказывается, у них заявки в ручном режиме обрабатываются. Пишут, что так больше получают обратной связи. В будущем грозятся сделать всё в автомате.

Сама кластеризация, пишут, длилась меньше минуты. Цитата:

На просчет вашей заявки ушло меньше минуты. Самое большое, что приходилось на данный момент обрабатывать — 55к, расчет шел около 3 часов.

Что пишут про алгоритм работы:

Алгоритм группировки разработан свой. Данные — топ 10 яндекса по каждому запросу. Машинное обучение используем, но для другого функционала, который скоро будет представлен.
Есть проблемы с релевантными страницами в отчете. В индекс поисковика не всегда попадает то, что нужно, особенно, если над проектом еще не работал специалист.
В результате приходится дополнительно обрабатывать результат руками, при определенном кол-ве запросов это уже грустно. Задача в процессе решения.

Кластеризация моих 562 запросов обошлась мне в 309 рублей. Имеем 60 копеек за запрос. Скидок не давали. Да я и не просил.

Теперь посмотрим что там с качеством:

обрезка черешни как правильно обрезать черешню обрезка молодой черешни сорта черешни черешнЯ сорта черешнЯ дерево валерий чкалов черешнЯ черешнЯ бычье сердце черешневый сад черешнЯ ипуть

Снова сорта остались без кластеров.

Достоинства

  • коммуникабельность тех поддержки, ответили на все вопросы
  • онлайн сервис

Недостатки

  • работает не в автоматическом режиме, человеческий фактор портит впечатление
  • платный
  • нужна ручная коррекция кластеров

Mc-Castle.ru — Кластеризатор СЯ

И ещё один сервис. Кластеризует тоже, видимо, по словоформе. Никаких поисковиков.

Результат работы:

Что с этим дальше делать я понять не смог. Как мне разбить по кластерам? Как посмотреть какие запросы попали в один кластер? Ну и если разбивка идёт на основе словоформ, то ни о каком объединении по смыслу речи не идёт.

Достоинства

  • онлайн сервис
  • бесплатный
  • не нужно регистрироваться

Недостатки

  • странный интерфейс
  • алгоритм разбивки на основе словоформ

Key Collector

Почти всем известная программа, кто так или иначе сталкивался со сбором ключей.

Группировка это только маленькая часть того, что она умеет.

Запросы можно сгруппировать по составу фраз, по выдаче поисковиков и в комбинированном режиме. Группировка на основе поиска работает кода собраны данные для KEI. На сбор информации для группировки ушло несколько минут. Сама группировка длилась меньше минуты.

Лучшей группировки удалось добиться со следующими параметрами:

В первом случае сгруппировалось 381 фраза или 68% от общего числа. Во втором случае 403 или 72%, что очень хорошо.

Интересующие нас черешни по сортам (ипуть, бычье сердце...) тоже и не попали к сортам. Были выделены в отдельные группы. Что, в общем, и не удивительно.

Остальные запросы сгруппировалась более или менее. В итоге имеем 72% экономии времени (остальное доделывать руками).

Достоинства

  • понятный интерфейс
  • можно подбирать настройки группировки
  • куча других возможностей по работе с ключами
  • демократичная цена
  • отличная тех поддержка

Недостатки

  • десктопная версия
  • нельзя редактировать получившиеся группы в программе — только в excel
  • для работы нужны антигейт, прокси, аккаунты — с онлайн сервисами таких заморочек нет, они берут эти проблемы на себя
  • нужна ручная коррекция кластеров

МегаЛемма — автоматизация составления семантического ядра и кампаний Яндекс.Директ

Десктопная программы для кластеризации.

Сложно просто взять и работать. Юзабилити хромает.

Жму нормализовать. Он мне выдаёт сообщение, что нужно сохранить проект. А автоматически нельзя сохранить проект? Зачем мне нажимать на кнопку, если это может сделать компьютер?

Не очевидно, что нажать, чтобы запустить процесс разбивки на группы. Оказывается это «частотный анализ».

Парсинг 562 запросов на стандартных настройках в 7 потоков и на 7 прокси занял примерно 10 минут. Ещё минут 5 заняла нормализация.

После нормализации снова непонятно как группировать нужные мне слова. Информацию нашёл на 27 странице руководства. И на том спасибо.

Ведь это же основной функционал программы. Разбивать слова на группы. Почему самая нужная информация находится так далеко? Ну и полезно было бы сделать что-то вроде quick start. Для контекста и для сайтов раздельно. Я понял, там есть различия в работе.

Доводить дело до конца по кластеризции своих запросов тут не захотелось. Основная проблема в расстановке акцентов в интерфейсе программы.

Чисто для кластеризации использовать смысла нет. Думаю, вся мощь программы должна проявиться при полной работе с ключами. Начиная с очистки запросов от мусора и создания стоп слов.

Достоинства

  • есть полноценная демоверсия

Недостатки

  • десктопная программа
  • для работы нужны антигейт и прокси — с онлайн сервисами таких заморочек нет, они берут эти проблемы на себя
  • объединяет на основе словоформ, то есть ни о каких смыслах говорить не приходится
  • юзабилити нужно дорабатывать

«Семён-Ядрён» — формирование семантического ядра сайта на основе поисковых систем

Ещё один удалённый сервис. В последнее время много пиарится.

Опять же с сервисом нужно работать через посредников. То есть через людей. Никакой тебе автоматики.

Нужно сначала подать бриф, потом подождать пока с тобой свяжутся. Согласовываешь детали. Затем оплата.

За бесплатно делать группировку не захотели, но сделали скидку в 50%. В итоге группировка 562 запросов мне обошлась в 350 рублей (без скидки просили 700). Сгруппировать один запрос вышло 60 копеек (или 1,2 рубля без скидок)

Опять же проблемы с юзабилити на сайте. Кнопка «подать бриф» маленкая, белая и незаметная на белом же фоне. Не удержался, простите.

Как и на основе чего делают кластеризацию, говорить отказались. Известно, только, что на основе выдачи ПС.

Результат работы прислали через несколько часов. Помимо самих кластеров прислали ещё 100500 параметров и файлов. Хотя я не просил. В принципе полезная информация для анализа. Но логично было бы разделить: хочешь просто кластеризацию — одна цена, хочешь ещё ништяков — другая. Так как разным клиентам нужна разная информация.

Посмотрим, какие кластеры получились:

обрезка черешни как правильно обрезать черешню обрезка молодой черешни черешня ипуть сорта черешни черешня сорта черешня бычье сердце валерий чкалов черешня черешня дерево черешневый сад

Это уже гораздо лучше! Отдельные сорта попали-таки в кластер по сортам! Правда, Валерий Чкалов потерялся.

Достоинства

  • быстро ответили
  • готовы делать скидки
  • онлайн сервис
  • куча различной доп информации, вплоть до заданий копирайтерам (правда пишут, что задания всё же нужно допиливать индивидуально)

Недостатки

  • есть посредник в виде человека
  • по алгоритмам сплошная коммерческая тайна
  • нужна ручная коррекция кластеров

Итоги

Сводную таблицу по функционалу и стоимости можно посмотреть ниже.

Инструмент Стоимость Алгоритм кластеризации Формат Время работы Стоимость группировки всех запросов Стоимость группировки одного запроса
бесплатно на основе выдачи ПС онлайн несколько минут бесплатно бесплатно
платный на основе выдачи ПС онлайн меньше минуты + два дня 309 р. 60 коп.
платный на основе словоформ онлайн меньше минуты бесплатно бесплатно
1 700 р. на основе словоформ + на основе выдачи ПС десктоп несколько минут
3 000 р. на основе словоформ и лемм десктоп несколько минут
платный на основе выдачи ПС онлайн несколько минут + пару часов 350 р.
(700 р. без скидки)
60 коп.
(1,2 р. без скидки)
Ниже представлены сервисы, не вошедшие в основной обзор в рамках данного поста, но были предложены пользователями в комментариях или представителями сервисов.
Topvisor.ru платный на основе выдачи ПС онлайн ~7-8 мин. на 3000 запросов от 30 коп.

В итоге пока не имеем инструмента, который на полном автомате сгруппирует нужные запросы без ошибок.

Наилучшие результаты показали (судил по сортам черешни) Semparser.ru и Seo-case.com. По стоимости получаем 48 копеек против 1,2 рубля соответственно. Разница почти в три раза. Дополнительная стоимость у Seo-case, я так думаю, за счёт бонусной информации. На следующем месте стоит Кей-Коллектор (так как он почти наверняка есть у человека, который занимается запросами).

Самый основательный подход по кластеризации, на мой взгляд, у ребят из Just-magic.org. Так что как только появится возможность, обязательно потестирую.

Как бы то ни было, работа руками лучше, чем любым сервисом и с этим сложно поспорить. Немного дороже, но намного качественнее.

На этом мега обзор заканчивается, дорогие друзья! Я уверен, вам понравилось, поэтому прошу вас оставить свое мнение в комментариях, а если вам есть, что добавить, то тем более отписывайтесь.

До связи друзья!

Кстати, можете обратить внимание, что есть даже .

Всё что нам нужно – это напротив каждой фразы указывать одним-двумя словами, о чём эта фраза. Нет никакого правила, просто ставьте такие слова или фразы, которые вы сразу запоминаете и, глядя на которые сразу поймете, о чём должна быть статья, в которую входят ключи, напротив которых вы их поставили.

Проше будет посмотреть на скриншот и всё станет ясно:

Поняли? Теперь всё что нам остаётся, это включить фильтр в Excel и фильтровать по группам. Каждая такая группа ключевых слов в семантическом ядре – это отдельная статья!

Всё очень просто! Возможно вам покажется, что это очень долго, но на самом деле для разгруппировки 1000-1500 запросов, при определённой сноровки, потребуется всего 20-30 минут!

Платный сервис разгруппировки – ТопВизор

После этого добавляем всё имеющееся семантическое ядро списком

Настраиваем в сервисе параметры кластеризации ядра и жмём «Начать»

Проходит какое-то время, и мы получаем разгруппированные запросы. Далее выгружаем эти запросы и если требуется (а в случае разбора реального семантического ядра это точно потребуется) догруппировавываем запросы, объединяя некоторые похожие по смысловой нагрузке группы друг с другом.

Огромным плюсом этого сервиса является возможность оплаты с помощью XML-лимитов

Бесплатные сервисы кластеризации запросов

Кроме платного группировщика от ТопВизора, также существуют и бесплатные онлайн сервисы кластеризации поисковых запросов.

Их функционал и юзабилити значительно скуднее, чем у платных аналогов, но зато вы можете провести разбивку запросов бесплатно без регистрации и смс, что в случае отсутствия средств поможет закрыть глаза на интерфейс и наличие различных фишек.

Кластеризатор от py7.ru

Интерфейс очень прост, запутаться невозможно. Добавляем запросы и жмём «Группировать»

Разгруппировщик от Сontentmonster

Так называемый ассистент от КонтентМонстра пока ещё находится в тестовом режиме, собственно поэтому у меня он почему-то ничего не разгруппировал, возможно вам повезёт больше 🙂

Вывод

Как видим, есть много способов и инструментов для кластеризации поисковых запросов. Разбить фразы на группы можно как в полностью в ручном режиме, так и прибегая к специализированные сервисам бесплатно или за деньги.

Однако, как бы там ни было, чем бы вы не пользовались, важно помнить, что кластеризация – это важный этап, лишь собрав и разобрав несколько семантических ядер, вы научитесь делать это правильно, в этом деле важен именно опыт.

Кстати, недавно на рынке появилась очень удобная и эффективная программа для , рекомендую ознакомится с моим обзором.

А если вы не хотите тратить время и собирать семантику и проводить кластеризацию, то вы всегда можете у меня.

Добрый день, Друзья. Сегодня у нас в гостях Анатолий Улитовский, известный SEO специалист Рунета. Анатолий нам расскажет о кластеризации ключевых слов.

Любое правильное продвижение начинается с семантического ядра. Основная цель которого — это оценить частотность, потенциального трафика и уровень конкуренции.

Платных и бесплатных сервисов, которые выполняют эту работу в интернете огромное количество. Но самое сложное начинается после составления списка ключей. Когда полученные ключи необходимо разбить по страницам сайта. Эту работу необходимо выполнять либо вручную, либо использовать специализированные кластеризаторы.

Что дает кластеризация

Кластеризация помогает составить удобную структуру сайта, облегчает перелинковку, увеличивает релевантность страницы продвигаемым запросам.

Немного теории

Вебмастера используют два принципиально разных подхода к кластеризации:

  1. По составу ключевых фраз. Запросы объединяют в группы на основе анализа входящих в них слов.
  2. По поисковой выдаче. Для каждого запроса находят ТОП выдачи и устанавливают порог совпадения – например, 50%. Те ключи, по которым в ТОП выдачи совпадет хотя бы половина страниц, объединяют в одну группу. Порог совпадения можно взять любой, анализировать можно любое количество результатов выдачи: ТОП-3, ТОП-5, ТОП-10, ТОП-20.

Второй метод кластеризации – на основе анализа выдачи – более популярен, чем первый:

Первые 6 сайтов считают кластеризацию синонимом группировки на основе поисковой выдачи. У 4 сайтов это видно уже в сниппете, оставшиеся (2-й и 6-й) пишут об этом на страницах.

Что выбрать?

Сторонники группировки ключей по поисковой выдаче игнорируют две вещи.

Во-первых, у каждой поисковой системы свои алгоритмы ранжирования. Посмотрите, как выглядит поисковая выдача для фразы «что такое кластеризация запросов» для пользователей Яндекса из Москвы:

Сравним ее с выдачей Google, приведенной ранее.

Кластеризация запросов по ТОП выдачи означает, что мы сосредоточимся на продвижении сайта только в одной поисковой системе.