Коэффициенты
В зависимости от того, к какой шкале относятся исследуемые переменные, рассчитываются разные виды коэффициентов корреляции:
- Коэффициент корреляции Пирсона, коэффициент парной линейной корреляции или корреляция моментов произведений рассчитывается для переменных с интервальной и количественной шкалой измерения.
- Коэффициент ранговой корреляции Спирмена или Кендалла – когда хотя бы одна из величин имеет порядковую шкалу либо не является нормально распределённой.
- Коэффициент точечной двухрядной корреляции (коэффициент корреляции знаков Фехнера) – если одна из двух величин является дихотомической.
- Коэффициент четырёхполевой корреляции (коэффициент множественной ранговой корреляции (конкордации) – если две переменные дихотомические.
Коэффициент Пирсона относится к параметрическим показателям корреляции, все остальные – к непараметрическим.
Значение коэффициента корреляции находится в пределах от -1 до +1. При полной положительной корреляции r = +1, при полной отрицательной – r = -1.
Онлайн сервисы для отслеживания корреляции
Метод удобен тем, что от пользователя нужно лишь выбрать инструменты, между которыми отслеживается связь. Появляется таблица онлайн, в которой в долях единицы или в процентах показывается уровень взаимосвязи между валютными парами, инструментами фондового рынка. Ниже – список неплохих сервисов, рассчитывающих корреляцию в режиме онлайн.
Myfxbook
Ссылка на сервис. Расчёты ведутся на таймфреймах от М5 до Monthly, трейдер сам выбирает временной интервал. В поиске можно задать граничные значения корреляции, отсеяв инструменты со слабыми связями. Поддерживаются десятки валютных пар, золото и нефть. По акциям, криптовалютам и прочим инструментам расчеты не ведутся.
Каждое значение в таблице – ссылка на более детальную информацию по связи между инструментами. Здесь в виде графика показывается изменение корреляции на истории.
Для сравнения можно добавить до 10 новых связей. В полях над графиком вводятся тикеры соответствующих инструментов, ниже отображаются новые кривые. Глубокая история недоступна, так что изучить изменения связей на дистанции в 5-10 лет невозможно.
Mataf
Ссылка на сервис. Функционал беднее по сравнению с myfxbook.com, но здесь есть тепловая карта, по ней удобно ориентироваться. В режиме онлайн пересчитываются связи между валютами, в зависимости от знака и значения ячейка таблицы окрашивается в зеленый или красный цвет.
Есть и графическое отображение изменения связей между финансовыми инструментами. Акции, криптовалюты и прочие инструменты не поддерживаются.
Investing
Ссылка на сервис. Подойдет для быстрой оценки связей между валютными парами. В соответствующем разделе на сайте выбирается инструмент, таймфрейм и число периодов, на которых выполняется расчет. Результаты выдаются и в табличной форме, и в виде графиков.
Поддерживается ограниченное количество инструментов, да и в целом по возможностям этот калькулятор корреляции валютных пар уступает myfxbook и mataf.
Что такое корреляция?
Начнем с такого примера. Вы наполняете свой инвестиционный портфель различными инструментами (акциями, облигациями, чем-то еще), но неожиданно замечаете, что в процессе инвестирования все результаты движутся преимущественно в одну сторону. Т.е. вы получаете либо заметную доходность, либо существенный убыток.
Если первая ситуация нас радует, то вторая сильно печалит и мы начинаем задумываться, все ли сделали правильно. И хотя убытки, даже порой затяжные, это неизбежная ситуация реального инвестирования, при составлении нашего портфеля действительно была допущена ошибка, исправление которой поможет заметно улучшить суммарную доходность. Причем решение в данной ситуации представляется достаточно очевидным — портфель должен состоять из активов, которые ведут себя по возможности независимо друг от друга, хотя каждый по отдельности способен быть источником денежного потока.
Корреляция описывается числом в интервале от 1 до -1. Единица со знаком плюс означает абсолютно идентичное движение активов (к такой ситуации, например, близки котировки USD/RUB и EUR/RUB), и в этом случае говорят о полной или максимальной положительной корреляции. Минус один описывает полностью противоположенное поведение, когда рост одного актива всегда вызывает убыток другого — это максимально отрицательная корреляция. Оба варианта скорее идеальные случаи, так что отрицательной корреляцией считается любое негативное значение.
Значение около нуля говорит об отсутствии зависимости между котировками. Т.е. в общем корреляция рассчитывается на основании эмпирических данных — подобная функция есть в Экселе — и поэтому зависит от интервала рассмотрения активов. Корреляция финансовых инструментов имеется как на форекс, так и на фондовом рынке — рассмотрим их отдельно.
Зависимость корреляции от времени
Как уже упоминалось выше, корреляция не является константой и сама меняется в зависимости от времени. К примеру, корреляция между акциями США и пятилетними гос. облигациями с 1926 по 2013 годы была равна 0.07 — т.е. зависимость почти не прослеживалась. Однако на истории корреляция колебалась от -0,5 до +0,5, причем в XX веке после Великой Депрессии она находилась в отрицательной зоне лишь с середины 50-х по середину 60-х годов. В период с 1970-1985 корреляция акций и облигаций была равна 0.3%, тогда как с 2002-2013 обратной по знаку:
Таким образом, задача поиска доходности зависит от двух неизвестных: корреляции и доходности активов на рассматриваемом промежутке, причем эта доходность достигается с различным риском (отклонением от среднего значения). Отрицательная корреляция в общем случае позволяет достигать большей доходности с меньшим риском по сравнению с менее доходным активом:
Фонд А — менее волатильный и менее доходный актив (облигации), фонд Б — более волатильный и доходный (акции). Стандартное отклонение определяет размах колебаний относительно среднего значения актива. Такое соотношение, как на рисунке выше, наблюдается на длинной истории — однако в пределах десятилетий может довольно сильно меняться:
Видно, что на протяжении 2000-2009 годов американские акции даже ушли в минус, в результате чего кривая получила движение вниз, а не вверх. Следовательно, корреляция ничего не говорит об абсолютной доходности — первая может мало меняться на протяжении 20 лет, однако результаты одинаковых портфелей на следующих друг за другом 10-летних промежутках разойдутся.
Так, в кризисные 70-е и растущие 80-е корреляция американских акций и 5-летних облигаций была в среднем одинакова (около 0.25), однако доходность портфеля 50 на 50 во втором случае была 15% годовых, а в первом лишь около 7%. Ниже отдельно показаны наилучшее и наихудшее американское десятилетие с 1950 года:
История
Корреляция — это понятие из биологии. Именно благодаря работе Фрэнсиса Гальтона корреляция становится статистической концепцией. Однако для Гальтона понятие корреляции точно не определено, и он сначала приравнивает его к линии регрессии модели линейной регрессии .
Именно тогда Карл Пирсон предложил в 1896 году математическую формулу для понятия корреляции и оценку этой величины.
Корреляция была введена в экономику Элементами статистики» Боули в 1902 году и вмешательством Джорджа Удни Юла в 1909 году. Юл, в частности, ввел понятие частичной корреляции .
Использование коэффициента корреляции вызвало серьезные споры. Например, Морис Фреше категорически против этого, показывая трудности интерпретации этого параметра.
Измерение корреляции
Статистика предлагает измерять корреляционную взаимосвязь с помощью числового коэффициента, в который будет входить ее величина и направление. Чем больше это число, тем сильнее взаимная связь параметров. Направление взаимодействия будет определяться знаком коэффициента корреляции.
Отрицательный знак будет означать, что уменьшение одной величины ведет к росту другой. Например, уменьшение количества бензина, выдаваемого полицейским патрульным машинам, приведет к повышенным показателям хулиганских действий на улицах.
При отсутствии корреляции говорят, что она равна нулю. Уровень воды в реке во время паводка может быть никак не связан с количеством заболеваний гриппом.
Ложные корреляции
Дело в том, что с помощью коэффициента корреляции можно проверить на взаимосвязь любые явления, которые можно выразить в числовом выражении. То есть, реально любые — например количество свадеб в Нью-Йорке и объем импорта нефти в США из Норвегии:
tylervigen.com — если знаете английский, сможете отыскать на сайте еще больше странных корреляций
Корреляция составила 86%! Действительно ли свадьбы влияют на экспорт нефти? Разумеется, нет — подобная зависимость совершенно случайна. Именно так выглядит ловушка ложной корреляции — она может показать взаимосвязь там, где её на самом деле нет.
Похожие термины:
-
корреляция между дихотомической и количественной переменными , предполагающая, что дихотомическая переменная образовалась в результате группирования количественной переменной в два интервала.
-
англ. correlation, partial; нем. Korrelation, partielle. Измерение корреляции двух признаков посредством исключения контрольных переменных.
-
англ. correlation, canonic(al); нем. Korrelation, kanonische. Обобщение парной корреляции, используемое для определения взаимосвязи между двумя группами признаков.
-
curvilinear correlation) — см. Корреляция.
-
связь между двумя переменными, которая может быть описана посредством прямой линии.
-
фальшивая, хотя и очевидная, связь между двумя (или несколькими) переменными, вызванная какой-то другой переменной.
-
англ. correlation, multiple; нем. Korrelation, multiple. Корреляция между одной зависимой переменной и комбинацией двух или более независимых переменных, к-рая дает оценку смешанного влияния на зависимую переменную.
-
англ. correlation nonlinear; нем. Korrelation, unlineare. Корреляция, при к-рой отношение степени изменения одной переменной к степени изменения другой переменной является изменяющейся величиной.
-
См. КОРРЕЛЯЦИЯ ОТРИЦАТЕЛЬНАЯ.
-
англ. correlation, negative; нем. Korrelation, negative. Корреляция, при к-рой увеличение одной переменной связано с уменьшением другой переменной. В этом случае коэффициент корреляции имеет отрицательные значения в
-
англ. correlation, positive; нем. Korrelation, positive. Корреляция, при к-рой увеличение одной переменной связано с увеличением другой переменной. В этом случае коэффициент корреляции имеет положительные значения, в
-
англ. correlation, rank; нем. Rangkorrelation. Корреляция, измеряющая степень соответствия упорядочения совокупности объектов по двум переменным. См. КОРРЕЛЯЦИЯ ЛИНЕЙНАЯ.
-
sociolinguistic correlation. — Соотношение между языковыми и экстралингвистическими компонентами (переменными) коммуникативной ситуации (например, корреляция между уровнем образования и уровнем владения язы
-
корреляция между двумя дихотомическими переменными , предполагающая, что обе переменные образовались в результате группирования количественных переменных в два интервала. Показывает, какой был
-
xenonymic correlation греч. xenos ‘чужой’ + лат. correlatio ‘соотношение’ — термин российского лингвиста В.В. Кабакчи (1998). — Связь, устанавливающаяся между ксенонимом и соответствующим исходным идионимом: Kremlin = ‘
-
Устойчивые, повторяющиеся взаимосвязи, соотношения, взаимодействия и взаимозависимости между определенными социальными явлениями, процессами и системами, их свойствами, признаками и характерис
-
см. КОРРЕЛЯЦИЯ.
-
Метод обработки социолингвистических данных, применяемый для изучения взаимосвязей между переменными величинами, зависимыми и независимыми (независимые переменные – социальные параметры: стра
-
это исследования, выявляющие наличие естественных связей между двумя или несколькими факторами.
-
англ. соefficient, rank correlation Kendall; нем. Kendalls Rangkorrelationskoeffizient. Коэффициент корреляции, определяющий степень соответствия упорядочения всех пар объектов по двум переменным.
А как посчитать корреляцию
Коэффициент корреляции рассчитывается по специальной сложной формуле:
Но сейчас нет необходимости считать вручную корреляцию между активами. Есть альтернативные способы:
- с помощью Excel;
- с помощью подходящего онлайн-сервиса;
- визуальный.
Excel
Для начала выберем активы. Возьмем ради примера акции «Яндекса» (YNDX) и «Магнита» (MGNT).
Далее необходимо взять цены котировок акций за один и тот же определенный промежуток времени. Можно выгрузить данные с помощью функции «Экспорт котировок акций» на сайте «Финам». Необходимо выбрать формат файла — .cvs. И взять помесячные данные за последний год:
Далее можно выбрать цену открытия, самую высокую, самую низкую и цену закрытия. В нашем примере мы взяли последнее значение — цену закрытия.
Далее объединяем месячные котировки цен по двум активам:
И после всех манипуляций приступаем к расчетам, используя встроенную функцию =КОРРЕЛ(массив1;массив2), где в массиве 1 выбираем диапазон котировок акций «Яндекса», а в массиве 2 — «Магнита»:
Наше полученное значение — 0,755. Получается, у стоимости акций «Яндекса» и «Магнита» высокая корреляция, то есть прямая зависимость.
Правда, для более точных выводов стоит брать данные за больший промежуток времени, чтобы было 50–100 значений.
Онлайн-сервисы
Из легкодоступных сервисов, где можно смотреть корреляцию, есть Portfolio Visualizer. Тут достаточно простой интерфейс, можно вписать через пробел интересующие активы, выбрать отслеживаемый промежуток и другие показатели:
Большущий минус — у этого онлайн-сервиса нет возможности ввести акции Московской биржи, а также российские БПИФы.
Как мы видим, акции «Яндекс», Apple, Microsoft, Intel, HP имеют слабую или умеренную прямую корреляцию друг с другом, хотя все компании из одного экономического сектора — информационные технологии.
А вот результаты корреляции акций нефтяных американских компаний. Тут уже более сильная корреляционная связь:
Визуально
Лучше один раз увидеть, чем сто раз что-то считать.
Да, этот метод не такой надежный, но хотя бы ориентировочно можно разглядеть, есть ли зависимость между активами.
К примеру, на сайте TradingView можно ввести в поисковое окно сначала первый актив, а потом в открывшемся окне добавить другие тикеры активов:
После того как ввели необходимое количество сравниваемых активов, смотрим на результаты:
В нашем примере видно, что акции «ЛУКОЙЛа» и «Газпрома» по большей части имеют прямую корреляцию.
Корреляционное исследование
Корреляционные исследования проводятся, чтобы оценить взаимосвязь между параметрами (переменными), которые исследователь не контролирует. Анализ всегда осуществляется в естественной среде.
Наиболее результативными корреляционные исследования являются те, в которых собирается большое число данных. Например, при изучении, как и насколько понимают распоряжения начальника его подчиненные. В таком исследовании изучаются личностные качества начальника:
- уравновешенность;
- настойчивость;
- требовательность;
- оптимизм;
- дисциплинированность;
- скромность;
- доброта;
- справедливость.
Во время исследования рассматривается зависимость восприятия начальника, понимания его распоряжений от демографических характеристик подчиненных (возраста, пола, семейного положения), а также их статуса в коллективе.
Корреляционный анализ позволяет выявить взаимосвязь между независимыми переменными, на которые психолог никак не влияет. Результаты анализа часто берутся в основу гипотезы дальнейших эмпирических исследований.
4) линейный коэффициент корреляции
Этот коэффициент как раз и оценивает тесноту линейной корреляционной зависимости и более того, указывает её направление (прямая или обратная). Его полное название: выборочный линейный коэффициент пАрной корреляции Пирсона
– «выборочный» – потому что мы рассматриваем выборочную совокупность;
– «линейный» – потому что он оценивает тесноту линейной корреляционной зависимости;
– «пАрной» – потому что у нас два признака (бывает хуже);
– и «Пирсона» – в честь английского статистика Карла Пирсона, это он автор понятия «корреляция».
И в зависимости от фантазии автора задачи вам может встретиться любая комбинация этих слов. Теперь нас не застанешь врасплох, Карл.
Линейный коэффициент корреляции вычислим по формуле:, где: – среднее значение произведения признаков, – признаков и – признаков. Числитель формулы имеет особый смысл, о котором я расскажу, когда мы будем разбирать второй способ решения.
Осталось разгрести всё это добро Впрочем, все нужные суммы уже рассчитаны в таблице выше. Вычислим средние значения:
Стандартные отклонения найдём как корни из соответствующих :
Таким образом, коэффициент корреляции:
И расшифровка: коэффициент корреляции может изменяться в пределах и чем он ближе по модулю к единице, тем теснее линейная корреляционная зависимость – тем ближе расположены точки к прямой, тем качественнее и достовернее линейная модель. Если либо , то речь идёт о строгой линейной зависимости, при которой все эмпирические точки окажутся на построенной прямой. Наоборот, чем ближе к нулю, тем точки рассеяны дальше, тем линейная зависимость выражена меньше. Однако в последнем случае зависимость всё равно может быть! – например, нелинейной или какой-нибудь более загадочной. Но до этого мы ещё дойдём. А у кого не хватит сил, донесём
Для оценки тесноты связи будем использовать уже знакомую шкалу Чеддока:
При этом если , то корреляционная связь обратная, а если , то прямая.
В нашем случае , таким образом, существует сильная обратная линейная корреляционная зависимость – суммарной успеваемости от – количества прогулов.
Линейный коэффициент корреляции – это частный аналог . Но в отличие от отношения, он показывает не только тесноту, но ещё и направление зависимости, ну и, конечно, здесь определена её форма (линейная).
Похожие термины:
-
(serial correlation) Ситуация, когда значение переменной стохастического временного ряда не является независимым от значения, которое она имела в предшествующие периоды. Если x(t) – переменная временного р
-
Термин, принятый в статистике для определения степени зависимости между двумя переменными величинами. См. Correlation coefficient.
-
расходование большей пропорции денег на некоторые виды маркетинга с целью повысить эффективность всей программы.
-
(rank correlation) Метод проверки зависимости между двумя переменными с помощью определения корреляции их ранговых порядков. Этот метод может быть использован, если предполагается, что зависимость монот
-
Показатель степени линейной зависимости между двумя переменными величинами: Коэффициент корреляции может изменяться в пределах от +1 до -1. Если большим значениям одной величины соответствуют бол
-
число, показывающее степень тесноты корреляции (связи), измеряемое от (-1) до (+1).
-
характеризует тесноту связи между результатным показателем и набором факторных показателей:
-
математико-статистическая теория, изучающая зависимости вариации признака от окружающих условий.
-
характеризует тесноту связи между результативным показателем и набором факторных показателей.
-
показатель, указывающий на то, какой процент изменения зависимой переменной обусловливается изменениями независимой переменной- Этот показатель варьирует от 0 до 1. Нуль означает, что изменения н
-
величина, рассчитываемая по наблюдениям над двумя случайными величинами и характеризующая степень их связи; отношение ковариации двух случайных величин к произведению их средних квадратических
-
отношение алгебраического дополнения Aij, умноженного на минус единицу, к корню квадратному из произведения алгебраических дополнений элементов rij, и rji матрицы выборочных коэффициентов корреляци
-
(rx. y.z) — используется в анализе хозяйственной деятельности при изучении связи между показателями х и у, когда требуется исключить воздействие третьего показателя z, выступающего как общий фактор
-
(Correlation) — разновидность причинно-следственной связи, когда между изучаемыми признаками нельзя установить, какой из них является причиной, а какой следствием, т.е. причинность имеет скрытый характе
-
соотношение, соответствие, зависимость между двумя случайными переменными, при этом каждому значению одной случайной переменной соответствует определенное условное математическое ожидание (ср
-
Графическое пре дставле н и е дан ных, при котором наблюдаемые значения одной переменной, соответствующие значениям другой переменной, наносятся на график в виде точек, не соединенных линиями. Диа
-
наиболее распространенный метод моделирования взаимосвязи показателей, когда зависимость между ними является стохастической (вероятностной).
-
способ установления линейной зависимости и тесноты связи между параметрами (численностью персонала и влияющими на нее факторами). Математический аппарат К. и р.а. подробно рассматривается в специ
-
раздел математической статистики, изучающий взаимную зависимость случайных величин.
-
Корреляционный риск — риск потерь в результате изменений в корреляции между финансовыми инструментами, валютами или рынками.