Корреляционный анализ

Корреляционный анализ представляет собой статистический метод, который позволяет определить, есть ли какая-то связь между двумя переменными и насколько сильной является имеющаяся зависимость.

Корреляционный анализ

Этот вид анализа подходит только в том случае, если данные являются количественными и выражены в виде чисел. Им нельзя воспользоваться для обработки категорийных данных, таких как пол, бренды или цвета. По результатам такого анализа получают одно число, которое находится в пределах от 1 до -1 и описывает степень зависимости между двумя переменными. Если результат положительный, то две переменные положительно коррелируют друг с другом, т. е. тогда, когда одна из них становится больше, другая обычно также становится более высокой. Если результат отрицательный, то две переменные отрицательно коррелированы друг с другом, т. е. всякий раз, когда одна из них становится больше, другая, как правило, уменьшается. Так, если (это гипотетический пример) корреляционный анализ показал, что между ростом человека и коэффициентом его умственного развития (intelligence quotient — IQ) корреляция составляет +0,73, то у более высокого человека выше вероятность того, что у него более высокий IQ (по сравнению с более низким человеком). И наоборот, если установлено, что корреляция этих двух переменных равна -0,64, то скорее всего у более высокого человека IQ будет более низким.

Положительная оценка означает прямую корреляцию, отрицательная — обратную.

При нуле никакой корреляции между двумя оцениваемыми переменными нет. Чем ближе оценка находится к 1 как со знаком плюс, так и минус, тем более сильной является корреляция. Результат считается о статистически значимыми, т. е. заслуживающим внимания, если результат равен 0,5 или выше при любом знаке.

Когда следует применять инструмент

Корреляционный анализ наиболее полезен, когда вы знаете или «подозреваете», что между двумя переменными существует зависимость, и вы хотели бы проверить свое предположение. Например, вы можете считать, что объем продаж в какой-то мере зависит от температуры на улице. Мороженое действительно покупают больше в жаркую погоду, но есть ли связь между температурой и вашим товаром или услугой? Чтобы выяснить это, можно воспользоваться корреляционным анализом.

Вы также можете использовать корреляционный анализ и тогда, когда хотите узнать, у какой из нескольких пар переменных корреляция является самой высокой. Предположим, вы можете узнать, влияет ли температура на объем продаж больше, чем, например, время года.

И наконец, вы можете использовать этот вид анализа умозрительно, чтобы посмотреть, как себя могут проявить наборы количественных данных. Иногда корреляционный анализ позволяет выявить наличие совсем неожидаемой зависимости, которая может стать основой для проведения дальнейшего анализа и потенциального ее использования. Например, компания Walmart обнаружила неожиданную зависимость между продажей печенья «Рор-Tarts» со сладкой двухслойной начинкой и предупреждениями о приближении урагана. Складывается впечатление, что при предупреждениях в США о наступлении суровых условий продажа этого печенья возрастает. Это знание позволило Walmart после предупреждения о приближении урагана размещать данный товар на входе в свои магазины, что привело к еще более сильному росту его продаж. Неожиданная корреляция в США также была обнаружена между продажами пива и подгузников. Предполагается, что мать ребенка, отправляя мужа в магазин за памперсами, как бы намекает, что в ближайшие выходные он никуда не пойдет, поэтому муж покупает и пиво, чтобы скрасить свой досуг. Выявление таких зависимостей может быть, конечно, чрезвычайно полезным и привести к еще более высоким объемам продаж, для чего потребуется провести в магазине лишь небольшое изменение местоположений продуктов.

Вопросы, на которые можно получить ответ с помощью инструмента

Самое главное, корреляционный анализ может помочь вам установить зависимости между количественными переменными, благодаря чему вы сможете принимать более обоснованные решения и улучшить показатели своего бизнеса. К тому же он может помочь вам получить ответы на следующие и им подобные вопросы.

  • Являются ли наши самые верные клиенты и самыми ценными для нас, т. е. приносящими максимальную прибыль?
  • Действительно ли клиенты покупают больше при более низкой цене продуктов?
  • Действительно ли арендная ставка влияет на срок аренды?
  • Действительно ли число ежегодных праздников влияет на число прогулов работников?
  • Есть ли какая зависимость между фактором X и фактором Y?

Корреляционный анализ может иметь большое значение для тестирования допущений, проводимого до осуществления изменений стратегии или ассортимента продукции.

Как следует пользоваться инструментом

Если вы достаточно храбры и если у вас под рукой есть калькулятор, то можете воспользоваться показателем, известным как «коэффициент корреляции Пирсона»:

Коэффициент корреляции Пирсона

где п — количество переменных.

  1. Прежде всего вам необходимо собрать данные по тем двум переменным, которые вы хотите проанализировать. Вы можете рассчитать корреляцию для любого набора количественных данных.
  2. Создайте электронную или обычную таблицу, в которой наборы данных расположены в столбцах по вертикали. В первый столбец, озаглавленный х, включите все данные по первой переменной (я), а во второй, озаглавленный у, — все данные по второй переменной (у).
  3. Обозначьте третий, четвертый и пятый столбцы соответственно «ху», «хх» и «уу».
  4. Выполните соответствующие расчеты, относящиеся к столбцам три, четыре и пять, т. е. ху = х умножить на у, хх = х умножить на х и уу = у умножить на у.
  5. Вставьте все значения в ячейки каждого столбца и получите общую сумму, которую укажите в нижней части столбца.
  6. Вставьте полученные числа в уравнение, чтобы определить корреляцию между анализируемыми переменными.

Формула

Как вариант, вы также можете воспользоваться соответствующим программным обеспечением, поскольку на рынке предлагается множество инструментов для вычисления показателя корреляции.

Более того, вы можете облегчить себе задачу, если используете такое программное обеспечение для персональных компьютеров, как Microsoft Excel, в который встроены формулы для расчета корреляции. Разобраться в том, как работает такое программное обеспечение, помогут различные статьи в Интернете, которые легко там найти.

Практический пример

Предположим, вы хотите выяснить, существует ли какая-то зависимость между ценой, которую вы установили на свой продукт, и числом единиц этого товара, проданных по этой цене. Часто предполагается, что, чем дешевле продукт, тем больше единиц этого продукта вы, вероятно, продадите, но эта гипотеза не всегда верна. Понимая, насколько для выручки и роста бизнеса важны цена и объем продаж, вы решили, что пришло время, чтобы на самом деле определить» верным ли является это предположение.

Полученный результат указывает на то, что статистически значимой корреляции между ценой и числом проданных единиц товара не существует.

О чем не нужно забывать

Если у вас уже есть данные, вы, возможно, захотите попробовать провести с ними ориентировочный корреляционный анализ, чтобы посмотреть, нет ли каких-либо неожиданных зависимостей или связей, которыми вы могли бы воспользоваться для обеспечения дополнительных продаж.

Если две переменные коррелированы, из этого еще не следует, что одна из них приводит к появлению другой; наличие корреляции лишь означает, что между ними есть определенная зависимость. Не попадитесь в ловушку, а для этого не исходите из предположения, что в данном случае зависимость является причинно-следственной. В то же время верно и другое: тот факт, что две переменные не коррелируют друг с другом, не означает, что они не зависят друг от друга.

Чтобы до конца выяснить, действительно ли зависимость является причинно-следственной, нужно провести бизнес-эксперимент.

Корреляционный анализ является одним из основных статистических методов и более подробно описывается и рассматривается в книгах и на сайтах по статистике.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (3 оценок, среднее: 4,67 из 5)
Загрузка...