Статистические методы — математические способы изучения данных, которые в том числе используют в маркетинговых исследованиях.
Статистические методы позволяют анализировать массивы данных и находить в них закономерности, проверять гипотезы и строить прогнозы. В маркетинге таким образом анализируют информацию о продукте, клиентах, продажах и рекламных кампаниях. Например, сегментируют покупателей в зависимости от разных факторов.
Статистические методы — количественные. Поэтому с их помощью можно увидеть итоги работы в цифрах и спрогнозировать результаты будущих кампаний и нововведений. Это важно для принятия бизнес-решений, особенно когда речь идет о высоких рисках. Например, можно спрогнозировать, как повлияют разные изменения в компании на объемы продаж, сколько новых клиентов принесет рекламная кампания, какая цена на ваши услуги покажется аудитории справедливой и так далее.
Наиболее часто в маркетинге используют следующие виды анализа:
- корреляционный,
- регрессионный,
- дисперсионный,
- факторный,
- кластерный,
- когортный
- описательный.
О каждом из них подробнее расскажем ниже.
Корреляционный анализ
Определяет характер зависимости какого-либо явления от одного или нескольких других. Корреляция бывает положительной и отрицательной, сильной и слабой, прямой и обратной.
Например, может существовать положительная корреляция между количеством писем, отправленных клиентам, и последующим увеличением продаж. Значит, она положительная.
Подробнее о корреляционном анализе
Регрессионный анализ
Как и корреляционный анализ, регрессионный определяет, как именно какое-то явление зависит от одного или нескольких других. Однако между этими методами есть разница. Если корреляция показывает общую тенденцию, то регрессия помогает увидеть её в конкретных цифрах.
Подробнее о регрессионном анализе
Способ позволяет прогнозировать результаты маркетинговых мероприятий. Например, анализ прошедшей рекламной кампании в соцсети показал, что увеличение бюджета на 1000 рублей в среднем приводит двух новых подписчиков. Можно просчитать заранее, что в следующий раз за 50 000 рублей компания привлечет около 100 человек (если другие параметры останутся прежними).
Факторный анализ
Измеряет, как разные условия влияют на результат какого-то процесса. Для анализа сначала выявляются основные факторы, которые влияют на результат (переменную). Затем выбирают один фактор и смотрят, как он влияет на результат. Далее эта процедура повторяется с другими. В конце выясняется, каким факторам нужно уделить особое внимание.
Например, производитель мороженого замечает, что на выручку влияют цена, упаковка и расходы на рекламу. Изучив прошлые данные и отзывы покупателей, он решает начать с упаковки. Тогда он меняет дизайн и анализирует уровень продаж до и после изменений.
Факторный анализ простой, но может показать ложную зависимость. В примере с картинки кажется, что гипотеза оправдалась: новая упаковка привлекла дополнительных покупателей. На самом же деле, скорее всего, повлияла сезонность. В жару мороженое пользуется спросом, а к осени продажи снова начнут падать. Чтобы результаты были точнее, исследуют влияние не одного, а всех возможных факторов.
С помощью факторного анализа маркетологи решают разные задачи. Например, сегментируют аудиторию: определяют, как влияют на продажи такие факторы, как возраст, пол, финансовые возможности и подобные.
Кластерный анализ
Помогает объединить разрозненные элементы в группы на основе выбранных переменных. В результате формируются кластеры, элементы внутри которых более похожи друг на друга, чем на элементы из других кластеров. Например, маркетологи сегментируют с его помощью целевую аудиторию.
Чтобы провести кластерный анализ, нужны хотя бы две переменные. Например, возраст клиента и общая сумма его покупок. Результат каждого потребителя выглядит как точка на диаграмме. Покупатели с похожими показателями на схеме оказываются рядом и образуют собой кластеры. Результаты позволяют маркетологам адаптировать свои стратегии к разным сегментам ЦА.
Когортный анализ
Показывает, как ведут себя люди в разных группах — когортах. Анализ отличается от кластерного тем, что когорты выделяют по двум основным признакам: одинаковое действие и одинаковое время. Например, можно исследовать сегмент тех, кто скачал приложение (одно действие) в марте 2023 года (одно время). Их можно сравнивать с другими когортами: с установившими приложение в апреле, в мае, в июне и так далее.
Дисперсионный анализ
Дисперсия показывает различия между средними значениями в разных группах. Это делают для того, чтобы определить, есть ли между ними статистически значимая разница. Например,
- продавцы в магазине на Арбате в среднем продают на 9000 руб. в день,
- продавцы в точке на Тверской — в среднем на 7500 руб. в день,
- продавцы на Черкизовской — в среднем на 12 000 руб. в день,
- продавцы в Бутово — в среднем на 5500 руб. в день.
Анализ покажет, является ли разница между средними показателями в разных группах статистически значимой, или же она могла возникнуть случайно. Например, насколько средний чек за день различается:
- в группе магазинов в пределах центра Москвы (Арбат и Тверская) и в группе магазинов в спальных районах (Черкизовская, Бутово);
- в группе магазинов площадью больше 30 квадратных метров (например, ими окажутся Арбат и Черкизовская) и меньше этой площади (Тверская и Бутово);
- в группе магазинов, где работает по три продавца в день, и в той, где на смену выходят только двое.
Группы можно определять на основании самых разных факторов. В нашем примере — это расположение торговой точки, ее площадь и количество продавцов. Анализ покажет, как сильно эти параметры влияют на среднее значение — средний чек на группу.
Описательная статистика
Дескриптивная, или описательная статистика — это наиболее простой и наглядный способ исследования показателей. В маркетинге чаще всего используют меры центральной тенденции: среднее число, моду и медиану.
Меры центральной тенденции — способы описания статистической информации одним числом.
Среднее число. Обычно подсчитывают среднее арифметическое. Для этого сумму чисел делят на их количество. Один из популярных показателей в маркетинге и продажах — средний чек.
Например, магазин хочет определить эффективность рекламы, которую запустили 1 февраля. В январе средний чек составил 1500 рублей. Через месяц после начала продвижения снова замеряют показатели. Для этого сначала считают средний чек за каждый из 28 февральских дней:
День | Чек, руб | День | Чек, руб | День | Чек, руб | День | Чек, руб |
1 | 2169 | 8 | 2415 | 15 | 3700 | 22 | 5392 |
2 | 3719 | 9 | 3780 | 16 | 2100 | 23 | 1490 |
3 | 1230 | 10 | 980 | 17 | 1230 | 24 | 1678 |
4 | 5392 | 11 | 50 | 18 | 5392 | 25 | 980 |
5 | 1490 | 12 | 1509 | 19 | 1490 | 26 | 50 |
6 | 1678 | 13 | 2300 | 20 | 1678 | 27 | 1509 |
7 | 3450 | 14 | 2700 | 21 | 3450 | 28 | 3400 |
Затем суммы складывают и делят на количество дней. Средний чек за февраль 2023 года — 2371 руб. С января он вырос почти на 900 рублей или на 58%. Значит, рекламная кампания оказалась успешной.
Мода. Значение, которое повторяется чаще других. Моду используют, когда ищут наиболее распространенное значение чего-то: цены, зарплаты, размера или формы популярного товара.
Например, сервис для email-рассылок собрал статистику по тому, сколько писем в день рассылают его клиенты. Результаты показали в таблице:
Клиент 1 | 250 |
Клиент 2 | 1000 |
Клиент 3 | 300 |
Клиент 4 | 500 |
Клиент 5 | 250 |
Мода — 250 писем в день, потому что число повторяется чаще остальных. Возможно, стоит сделать тариф с включенными 250 письмами. Среднее арифметическое из 460 писем никому не подойдет.
Медиана. Это значение, которое расположено посередине выборки. Чтобы найти медиану, исследуемые показатели выстраивают в порядке возрастания. Если количество чисел нечетное, то медиана — число посередине. Если чисел четное количество, тогда медиана — это среднее арифметическое из двух центральных чисел. Преимущество медианы в том, что она не учитывает выбросы.
Выброс — это аномальное число. Например, в магазин пришел покупатель-миллионер и за одну покупку сделал недельный план продаж.
Например, специалисты сервиса email-рассылок хотят понять, сколько в среднем денег клиенты готовы тратить на услуги. Для этого разместили онлайн-опрос на сайте, который прошли 15 посетителей (П):
П1 | П2 | П3 | П4 | П5 | П6 | П7 | П8 | П9 | П10 | П11 | П12 | П13 | П14 | П15 |
1200 | 3000 | 500 | 10000 | 0 | 2500 | 0 | 3000 | 1700 | 5000 | 8000 | 3500 | 1500 | 2000 | 0 |
Сначала все 15 чисел выстраивают по порядку. Количество нечетное, поэтому медианой будет центральное число: 0, 0, 0, 500, 1250, 1500, 1700, 2000, 2500, 3000, 3000, 3500, 5000, 8000 и 10000 рублей. В среднем люди готовы отдавать 2000 руб. за услуги компании.
Выбор способа описания зависит от исходных данных и цели измерения. Сравним три метода сразу:
Процентили. Массив данных делится на 100 равных частей — на 100 процентилей. 50-й процентиль — это медиана, то есть значение, которое находится ровно посередине. 25-й, 50-й, 75-й и 100-й процентили также называют квартилями.
Эти значения используют для того, чтобы определить выбросы, пики и тренды. Например, оказывается, что сайт компании иногда может долго загружаться. Чтобы проверить, насколько часто это происходит, можно использовать процентили.
Допустим, окажется, что для 96-го процентиля среднее время загрузки составляет 2 секунды. Это значит, что в 96% случаев сайт загружается быстро. И только для оставшихся 4% он бывает медленным.