Статистические методы

Одобренно экспертом
Александр Сокуренко
Эксперт статьи
Александр Сокуренко
кандидат экономических наук
Автор статьи
Наталья Грачева

Статистические методы — математические способы изучения данных, которые в том числе используют в маркетинговых исследованиях.

Статистические методы позволяют анализировать массивы данных и находить в них закономерности, проверять гипотезы и строить прогнозы. В маркетинге таким образом анализируют информацию о продукте, клиентах, продажах и рекламных кампаниях. Например, сегментируют покупателей в зависимости от разных факторов.

Статистические методы — количественные. Поэтому с их помощью можно увидеть итоги работы в цифрах и спрогнозировать результаты будущих кампаний и нововведений. Это важно для принятия бизнес-решений, особенно когда речь идет о высоких рисках. Например, можно спрогнозировать, как повлияют разные изменения в компании на объемы продаж, сколько новых клиентов принесет рекламная кампания, какая цена на ваши услуги покажется аудитории справедливой и так далее.

Наиболее часто в маркетинге используют следующие виды анализа:

  • корреляционный,
  • регрессионный,
  • дисперсионный,
  • факторный,
  • кластерный,
  • когортный
  • описательный.

О каждом из них подробнее расскажем ниже.

Подходящие для маркетинга статистические методы

Подходящие для маркетинга статистические методы

Корреляционный анализ

Определяет характер зависимости какого-либо явления от одного или нескольких других. Корреляция бывает положительной и отрицательной, сильной и слабой, прямой и обратной.

Например, может существовать положительная корреляция между количеством писем, отправленных клиентам, и последующим увеличением продаж. Значит, она положительная.

Подробнее о корреляционном анализе

Диаграмма рассеяния

Результаты корреляционного анализа удобно смотреть на диаграмме рассеяния. На ней каждое пересечение двух показателей показано в виде точки. Чем ближе друг к другу они расположены, тем сильнее корреляция

Полученные результаты важно проверить и с помощью других видов анализа, чтобы избежать ошибки. Дело в том, что на установленную связь между количеством писем и продаж могут влиять и другие факторы. Например, сезонность или пониженная активность конкурентов.

Александр Сокуренко

Александр Сокуренко

кандидат экономических наук

Регрессионный анализ

Как и корреляционный анализ, регрессионный определяет, как именно какое-то явление зависит от одного или нескольких других. Однако между этими методами есть разница. Если корреляция показывает общую тенденцию, то регрессия помогает увидеть её в конкретных цифрах. 

Регрессионный анализ на графике

Регрессию считают по формуле. На графике прямая показывает, на сколько в среднем увеличивается количество продаж при отправке большего числа писем. В нашем случае каждые 100 писем приносят компании примерно 10 продаж

Подробнее о регрессионном анализе

Способ позволяет прогнозировать результаты маркетинговых мероприятий. Например, анализ прошедшей рекламной кампании в соцсети показал, что увеличение бюджета на 1000 рублей в среднем приводит двух новых подписчиков. Можно просчитать заранее, что в следующий раз за 50 000 рублей компания привлечет около 100 человек (если другие параметры останутся прежними). 

Факторный анализ

Измеряет, как разные условия влияют на результат какого-то процесса. Для анализа сначала выявляются основные факторы, которые влияют на результат (переменную). Затем выбирают один фактор и смотрят, как он влияет на результат. Далее эта процедура повторяется с другими. В конце выясняется, каким факторам нужно уделить особое внимание.

Например, производитель мороженого замечает, что на выручку влияют цена, упаковка и расходы на рекламу. Изучив прошлые данные и отзывы покупателей, он решает начать с упаковки. Тогда он меняет дизайн и анализирует уровень продаж до и после изменений.

Факторный анализ в виде простого графика

С декабря мороженое продавалось более или менее линейно, примерно по 50 коробок в день. Потом производитель поменял упаковку. С марта продажи стали расти

Факторный анализ простой, но может показать ложную зависимость. В примере с картинки кажется, что гипотеза оправдалась: новая упаковка привлекла дополнительных покупателей. На самом же деле, скорее всего, повлияла сезонность. В жару мороженое пользуется спросом, а к осени продажи снова начнут падать. Чтобы результаты были точнее, исследуют влияние не одного, а всех возможных факторов. 

С помощью факторного анализа маркетологи решают разные задачи. Например, сегментируют аудиторию: определяют, как влияют на продажи такие факторы, как возраст, пол, финансовые возможности и подобные.

Кластерный анализ

Помогает объединить разрозненные элементы в группы на основе выбранных переменных. В результате формируются кластеры, элементы внутри которых более похожи друг на друга, чем на элементы из других кластеров. Например, маркетологи сегментируют с его помощью целевую аудиторию.

Чтобы провести кластерный анализ, нужны хотя бы две переменные. Например, возраст клиента и общая сумма его покупок. Результат каждого потребителя выглядит как точка на диаграмме. Покупатели с похожими показателями на схеме оказываются рядом и образуют собой кластеры. Результаты позволяют маркетологам адаптировать свои стратегии к разным сегментам ЦА.

Кластерный анализ в виде диаграммы рассеяния

Диаграмма помогает увидеть, что покупатели в возрасте от 20 до 30 лет делают преимущественно недорогие заказы от 1000 до 1500 рублей. Клиенты от 25 до 40 лет покупают на 3000–3700 рублей. Более взрослые клиенты вновь покупают меньше

Когортный анализ

Показывает, как ведут себя люди в разных группах — когортах. Анализ отличается от кластерного тем, что когорты выделяют по двум основным признакам: одинаковое действие и одинаковое время. Например, можно исследовать сегмент тех, кто скачал приложение (одно действие) в марте 2023 года (одно время). Их можно сравнивать с другими когортами: с установившими приложение в апреле, в мае, в июне и так далее.

Подробнее о когортном анализе

Когортный анализ на схеме

Результаты анализа показывают, насколько были активны пользователи приложения каждый месяц после регистрации. Так, например, можно увидеть, что количество активных юзеров сначала падает, но к 3-4 месяцу составляет стабильно около 40%. На основе этой статистики можно предположить, как поведут себя новые пользователи

Дисперсионный анализ

Дисперсия показывает различия между средними значениями в разных группах. Это делают для того, чтобы определить, есть ли между ними статистически значимая разница. Например,

  • продавцы в магазине на Арбате в среднем продают на 9000 руб. в день,
  • продавцы в точке на Тверской — в среднем на 7500 руб. в день,
  • продавцы на Черкизовской — в среднем на 12 000 руб. в день,
  • продавцы в Бутово — в среднем на 5500 руб. в день.

Анализ покажет, является ли разница между средними показателями в разных группах статистически значимой, или же она могла возникнуть случайно. Например, насколько средний чек за день различается:

  • в группе магазинов в пределах центра Москвы (Арбат и Тверская) и в группе магазинов в спальных районах (Черкизовская, Бутово);
  • в группе магазинов площадью больше 30 квадратных метров (например, ими окажутся Арбат и Черкизовская) и меньше этой площади (Тверская и Бутово);
  • в группе магазинов, где работает по три продавца в день, и в той, где на смену выходят только двое. 

Группы можно определять на основании самых разных факторов. В нашем примере — это расположение торговой точки, ее площадь и количество продавцов. Анализ покажет, как сильно эти параметры влияют на среднее значение — средний чек на группу. 

Описательная статистика

Дескриптивная, или описательная статистика — это наиболее простой и наглядный способ исследования показателей. В маркетинге чаще всего используют меры центральной тенденции: среднее число, моду и медиану.

 

Меры центральной тенденции — способы описания статистической информации одним числом.

Для многих расчетов можно использовать специальные функции в Excel. Они доступны в надстройке, которая называется «Пакет анализа». Ее можно установить через настройки Excel. С ее помощью можно посчитать и среднее число, и моду, и медиану, а также, например, провести дисперсионный анализ.

Александр Сокуренко

Александр Сокуренко

кандидат экономических наук

Среднее число. Обычно подсчитывают среднее арифметическое. Для этого сумму чисел делят на их количество. Один из популярных показателей в маркетинге и продажах — средний чек. 

Например, магазин хочет определить эффективность рекламы, которую запустили 1 февраля. В январе средний чек составил 1500 рублей. Через месяц после начала продвижения снова замеряют показатели. Для этого сначала считают средний чек за каждый из 28 февральских дней:

День Чек, руб День Чек, руб День Чек, руб День Чек, руб
1 2169 8 2415 15 3700 22 5392
2 3719 9 3780 16 2100 23 1490
3 1230 10 980 17 1230 24 1678
4 5392 11 50 18 5392 25 980
5 1490 12 1509 19 1490 26 50
6 1678 13 2300 20 1678 27 1509
7 3450 14 2700 21 3450 28 3400

Затем суммы складывают и делят на количество дней. Средний чек за февраль 2023 года — 2371 руб. С января он вырос почти на 900 рублей или на 58%. Значит, рекламная кампания оказалась успешной.

Мода. Значение, которое повторяется чаще других. Моду используют, когда ищут наиболее распространенное значение чего-то: цены, зарплаты, размера или формы популярного товара.

Например, сервис для email-рассылок собрал статистику по тому, сколько писем в день рассылают его клиенты. Результаты показали в таблице:

Клиент 1 250
Клиент 2 1000
Клиент 3 300
Клиент 4 500
Клиент 5 250

Мода — 250 писем в день, потому что число повторяется чаще остальных. Возможно, стоит сделать тариф с включенными 250 письмами. Среднее арифметическое из 460 писем никому не подойдет.

Медиана. Это значение, которое расположено посередине выборки. Чтобы найти медиану, исследуемые показатели выстраивают в порядке возрастания. Если количество чисел нечетное, то медиана — число посередине. Если чисел четное количество, тогда медиана — это среднее арифметическое из двух центральных чисел. Преимущество медианы в том, что она не учитывает выбросы.

 

Выброс — это аномальное число. Например, в магазин пришел покупатель-миллионер и за одну покупку сделал недельный план продаж.

Например, специалисты сервиса email-рассылок хотят понять, сколько в среднем денег клиенты готовы тратить на услуги. Для этого разместили онлайн-опрос на сайте, который прошли 15 посетителей (П):

П1 П2 П3 П4 П5 П6 П7 П8 П9 П10 П11 П12 П13 П14 П15
1200 3000 500 10000 0 2500 0 3000 1700 5000 8000 3500 1500 2000 0

Сначала все 15 чисел выстраивают по порядку. Количество нечетное, поэтому медианой будет центральное число: 0, 0, 0, 500, 1250, 1500, 1700, 2000, 2500, 3000, 3000, 3500, 5000, 8000 и 10000 рублей. В среднем люди готовы отдавать 2000 руб. за услуги компании.

Выбор способа описания зависит от исходных данных и цели измерения. Сравним три метода сразу:

Меры центральной тенденции в маркетинге

На среднее число выброс повлияет, а на медиану или моду — нет. В таблице показаны результаты за ноябрь и декабрь. Если план продаж на январь сделать на основе среднего в декабре, магазин его не выполнит

Процентили. Массив данных делится на 100 равных частей — на 100 процентилей. 50-й процентиль — это медиана, то есть значение, которое находится ровно посередине. 25-й, 50-й, 75-й и 100-й процентили также называют квартилями.

Эти значения используют для того, чтобы определить выбросы, пики и тренды. Например, оказывается, что сайт компании иногда может долго загружаться. Чтобы проверить, насколько часто это происходит, можно использовать процентили.

Допустим, окажется, что для 96-го процентиля среднее время загрузки составляет 2 секунды. Это значит, что в 96% случаев сайт загружается быстро. И только для оставшихся 4% он бывает медленным.

Главные мысли

статистические методы это

Вы нашли ответ?

14
4