Корреляция

Коэффициенты

В зависимости от того, к какой шкале относятся исследуемые переменные, рассчитываются разные виды коэффициентов корреляции:

  1. Коэффициент корреляции Пирсона, коэффициент парной линейной корреляции или корреляция моментов произведений рассчитывается для переменных с интервальной и количественной шкалой измерения.
  2. Коэффициент ранговой корреляции Спирмена или Кендалла – когда хотя бы одна из величин имеет порядковую шкалу либо не является нормально распределённой.
  3. Коэффициент точечной двухрядной корреляции (коэффициент корреляции знаков Фехнера) – если одна из двух величин является дихотомической.
  4. Коэффициент четырёхполевой корреляции (коэффициент множественной ранговой корреляции (конкордации) – если две переменные дихотомические.

Коэффициент Пирсона относится к параметрическим показателям корреляции, все остальные – к непараметрическим.

Значение коэффициента корреляции находится в пределах от -1 до +1. При полной положительной корреляции r = +1, при полной отрицательной – r = -1.

Онлайн сервисы для отслеживания корреляции

Метод удобен тем, что от пользователя нужно лишь выбрать инструменты, между которыми отслеживается связь. Появляется таблица онлайн, в которой в долях единицы или в процентах показывается уровень взаимосвязи между валютными парами, инструментами фондового рынка. Ниже – список неплохих сервисов, рассчитывающих корреляцию в режиме онлайн.

Myfxbook

Ссылка на сервис. Расчёты ведутся на таймфреймах от М5 до Monthly, трейдер сам выбирает временной интервал. В поиске можно задать граничные значения корреляции, отсеяв инструменты со слабыми связями. Поддерживаются десятки валютных пар, золото и нефть. По акциям, криптовалютам и прочим инструментам расчеты не ведутся.

Каждое значение в таблице – ссылка на более детальную информацию по связи между инструментами. Здесь в виде графика показывается изменение корреляции на истории.

Для сравнения можно добавить до 10 новых связей. В полях над графиком вводятся тикеры соответствующих инструментов, ниже отображаются новые кривые. Глубокая история недоступна, так что изучить изменения связей на дистанции в 5-10 лет невозможно.

Mataf

Ссылка на сервис. Функционал беднее по сравнению с myfxbook.com, но здесь есть тепловая карта, по ней удобно ориентироваться. В режиме онлайн пересчитываются связи между валютами, в зависимости от знака и значения ячейка таблицы окрашивается в зеленый или красный цвет.

Есть и графическое отображение изменения связей между финансовыми инструментами. Акции, криптовалюты и прочие инструменты не поддерживаются.

Investing

Ссылка на сервис. Подойдет для быстрой оценки связей между валютными парами. В соответствующем разделе на сайте выбирается инструмент, таймфрейм и число периодов, на которых выполняется расчет. Результаты выдаются и в табличной форме, и в виде графиков.

Поддерживается ограниченное количество инструментов, да и в целом по возможностям этот калькулятор корреляции валютных пар уступает myfxbook и mataf.

Что такое корреляция?

Начнем с такого примера. Вы наполняете свой инвестиционный портфель различными инструментами (акциями, облигациями, чем-то еще), но неожиданно замечаете, что в процессе инвестирования все результаты движутся преимущественно в одну сторону. Т.е. вы получаете либо заметную доходность, либо существенный убыток.

Если первая ситуация нас радует, то вторая сильно печалит и мы начинаем задумываться, все ли сделали правильно. И хотя убытки, даже порой затяжные, это неизбежная ситуация реального инвестирования, при составлении нашего портфеля действительно была допущена ошибка, исправление которой поможет заметно улучшить суммарную доходность. Причем решение в данной ситуации представляется достаточно очевидным — портфель должен состоять из активов, которые ведут себя по возможности независимо друг от друга, хотя каждый по отдельности способен быть источником денежного потока.

Корреляция описывается числом в интервале от 1 до -1. Единица со знаком плюс означает абсолютно идентичное движение активов (к такой ситуации, например, близки котировки USD/RUB и EUR/RUB), и в этом случае говорят о полной или максимальной положительной корреляции. Минус один описывает полностью противоположенное поведение, когда рост одного актива всегда вызывает убыток другого — это максимально отрицательная корреляция. Оба варианта скорее идеальные случаи, так что отрицательной корреляцией считается любое негативное значение.

Значение около нуля говорит об отсутствии зависимости между котировками. Т.е. в общем корреляция рассчитывается на основании эмпирических данных — подобная функция есть в Экселе — и поэтому зависит от интервала рассмотрения активов. Корреляция финансовых инструментов имеется как на форекс, так и на фондовом рынке — рассмотрим их отдельно.

Зависимость корреляции от времени

Как уже упоминалось выше, корреляция не является константой и сама меняется в зависимости от времени. К примеру, корреляция между акциями США и пятилетними гос. облигациями с 1926 по 2013 годы была равна 0.07 — т.е. зависимость почти не прослеживалась. Однако на истории корреляция колебалась от -0,5 до +0,5, причем в XX веке после Великой Депрессии она находилась в отрицательной зоне лишь с середины 50-х по середину 60-х годов. В период с 1970-1985 корреляция акций и облигаций была равна 0.3%, тогда как с 2002-2013 обратной по знаку:

Таким образом, задача поиска доходности зависит от двух неизвестных: корреляции и доходности активов на рассматриваемом промежутке, причем эта доходность достигается с различным риском (отклонением от среднего значения). Отрицательная корреляция в общем случае позволяет достигать большей доходности с меньшим риском по сравнению с менее доходным активом:

Фонд А — менее волатильный и менее доходный актив (облигации), фонд Б — более волатильный и доходный (акции). Стандартное отклонение определяет размах колебаний относительно среднего значения актива. Такое соотношение, как на рисунке выше, наблюдается на длинной истории — однако в пределах десятилетий может довольно сильно меняться:

Видно, что на протяжении 2000-2009 годов американские акции даже ушли в минус, в результате чего кривая получила движение вниз, а не вверх. Следовательно, корреляция ничего не говорит об абсолютной доходности — первая может мало меняться на протяжении 20 лет, однако результаты одинаковых портфелей на следующих друг за другом 10-летних промежутках разойдутся.

Так, в кризисные 70-е и растущие 80-е корреляция американских акций и 5-летних облигаций была в среднем одинакова (около 0.25), однако доходность портфеля 50 на 50 во втором случае была 15% годовых, а в первом лишь около 7%. Ниже отдельно показаны наилучшее и наихудшее американское десятилетие с 1950 года:

История

Корреляция — это понятие из биологии. Именно благодаря работе Фрэнсиса Гальтона корреляция становится статистической концепцией. Однако для Гальтона понятие корреляции точно не определено, и он сначала приравнивает его к линии регрессии модели линейной регрессии .

Именно тогда Карл Пирсон предложил в 1896 году математическую формулу для понятия корреляции и оценку этой величины.

Корреляция была введена в экономику Элементами статистики» Боули в 1902 году и вмешательством Джорджа Удни Юла в 1909 году. Юл, в частности, ввел понятие частичной корреляции .

Использование коэффициента корреляции вызвало серьезные споры. Например, Морис Фреше категорически против этого, показывая трудности интерпретации этого параметра.

Измерение корреляции

Статистика предлагает измерять корреляционную взаимосвязь с помощью числового коэффициента, в который будет входить ее величина и направление. Чем больше это число, тем сильнее взаимная связь параметров. Направление взаимодействия будет определяться знаком коэффициента корреляции.

Отрицательный знак будет означать, что уменьшение одной величины ведет к росту другой. Например, уменьшение количества бензина, выдаваемого полицейским патрульным машинам, приведет к повышенным показателям хулиганских действий на улицах.

При отсутствии корреляции говорят, что она равна нулю. Уровень воды в реке во время паводка может быть никак не связан с количеством заболеваний гриппом.

Ложные корреляции

Дело в том, что с помощью коэффициента корреляции можно проверить на взаимосвязь любые явления, которые можно выразить в числовом выражении. То есть, реально любые — например количество свадеб в Нью-Йорке и объем импорта нефти в США из Норвегии:


tylervigen.com — если знаете английский, сможете отыскать на сайте еще больше странных корреляций

Корреляция составила 86%! Действительно ли свадьбы влияют на экспорт нефти? Разумеется, нет — подобная зависимость совершенно случайна. Именно так выглядит ловушка ложной корреляции — она может показать взаимосвязь там, где её на самом деле нет.

Похожие термины:

  • корреляция между дихотомической и количественной переменными , предполагающая, что дихотомическая переменная образовалась в результате группирования количественной переменной в два интервала.

  • англ. correlation, partial; нем. Korrelation, partielle. Измерение корреляции двух признаков посредством исключения контрольных переменных.

  • англ. correlation, canonic(al); нем. Korrelation, kanonische. Обобщение парной корреляции, используемое для определения взаимосвязи между двумя группами признаков.

  • curvilinear correlation) — см. Корреляция.

  • связь между двумя переменными, которая может быть описана посредством прямой линии.

  • фальшивая, хотя и очевидная, связь между двумя (или несколькими) переменными, вызванная какой-то другой переменной.

  • англ. correlation, multiple; нем. Korrelation, multiple. Корреляция между одной зависимой переменной и комбинацией двух или более независимых переменных, к-рая дает оценку смешанного влияния на зависимую переменную.

  • англ. correlation nonlinear; нем. Korrelation, unlineare. Корреляция, при к-рой отношение степени изменения одной переменной к степени изменения другой переменной является изменяющейся величиной.

  • См. КОРРЕЛЯЦИЯ ОТРИЦАТЕЛЬНАЯ.

  • англ. correlation, negative; нем. Korrelation, negative. Корреляция, при к-рой увеличение одной переменной связано с уменьшением другой переменной. В этом случае коэффициент корреляции имеет отрицательные значения в

  • англ. correlation, positive; нем. Korrelation, positive. Корреляция, при к-рой увеличение одной переменной связано с увеличением другой переменной. В этом случае коэффициент корреляции имеет положительные значения, в

  • англ. correlation, rank; нем. Rangkorrelation. Корреляция, измеряющая степень соответствия упорядочения совокупности объектов по двум переменным. См. КОРРЕЛЯЦИЯ ЛИНЕЙНАЯ.

  • sociolinguistic correlation. — Соотношение между языковыми и экстралингвистическими компонентами (переменными) коммуникативной ситуации (например, корреляция между уровнем образования и уровнем владения язы

  • корреляция между двумя дихотомическими переменными , предполагающая, что обе переменные образовались в результате группирования количественных переменных в два интервала. Показывает, какой был

  • xenonymic correlation греч. xenos ‘чужой’ + лат. correlatio ‘соотношение’ — термин российского лингвиста В.В. Кабакчи (1998). — Связь, устанавливающаяся между ксенонимом и соответствующим исходным идионимом: Kremlin = ‘

  • Устойчивые, повторяющиеся взаимосвязи, соотношения, взаимодействия и взаимозависимости между определенными социальными явлениями, процессами и системами, их свойствами, признаками и характерис

  • см. КОРРЕЛЯЦИЯ.

  • Метод обработки социолингвистических данных, применяемый для изучения взаимосвязей между переменными величинами, зависимыми и независимыми (независимые переменные – социальные параметры: стра

  • это исследования, выявляющие наличие естественных связей между двумя или несколькими факторами.

  • англ. соefficient, rank correlation Kendall; нем. Kendalls Rangkorrelationskoeffizient. Коэффициент корреляции, определяющий степень соответствия упорядочения всех пар объектов по двум переменным.

А как посчитать корреляцию

Коэффициент корреляции рассчитывается по специальной сложной формуле:

Но сейчас нет необходимости считать вручную корреляцию между активами. Есть альтернативные способы:

  • с помощью Excel;
  • с помощью подходящего онлайн-сервиса;
  • визуальный.

Excel

Для начала выберем активы. Возьмем ради примера акции «Яндекса» (YNDX) и «Магнита» (MGNT).

Далее необходимо взять цены котировок акций за один и тот же определенный промежуток времени. Можно выгрузить данные с помощью функции «Экспорт котировок акций» на сайте «Финам». Необходимо выбрать формат файла — .cvs. И взять помесячные данные за последний год:

Далее можно выбрать цену открытия, самую высокую, самую низкую и цену закрытия. В нашем примере мы взяли последнее значение — цену закрытия.

Далее объединяем месячные котировки цен по двум активам:

И после всех манипуляций приступаем к расчетам, используя встроенную функцию =КОРРЕЛ(массив1;массив2), где в массиве 1 выбираем диапазон котировок акций «Яндекса», а в массиве 2 — «Магнита»:

Наше полученное значение — 0,755. Получается, у стоимости акций «Яндекса» и «Магнита» высокая корреляция, то есть прямая зависимость.

Правда, для более точных выводов стоит брать данные за больший промежуток времени, чтобы было 50–100 значений.

Онлайн-сервисы

Из легкодоступных сервисов, где можно смотреть корреляцию, есть Portfolio Visualizer. Тут достаточно простой интерфейс, можно вписать через пробел интересующие активы, выбрать отслеживаемый промежуток и другие показатели:

Большущий минус — у этого онлайн-сервиса нет возможности ввести акции Московской биржи, а также российские БПИФы.

Как мы видим, акции «Яндекс», Apple, Microsoft, Intel, HP имеют слабую или умеренную прямую корреляцию друг с другом, хотя все компании из одного экономического сектора — информационные технологии.

А вот результаты корреляции акций нефтяных американских компаний. Тут уже более сильная корреляционная связь:

Визуально

Лучше один раз увидеть, чем сто раз что-то считать.

Да, этот метод не такой надежный, но хотя бы ориентировочно можно разглядеть, есть ли зависимость между активами.

К примеру, на сайте TradingView можно ввести в поисковое окно сначала первый актив, а потом в открывшемся окне добавить другие тикеры активов:

После того как ввели необходимое количество сравниваемых активов, смотрим на результаты:

В нашем примере видно, что акции «ЛУКОЙЛа» и «Газпрома» по большей части имеют прямую корреляцию.

Корреляционное исследование

Корреляционные исследования проводятся, чтобы оценить взаимосвязь между параметрами (переменными), которые исследователь не контролирует. Анализ всегда осуществляется в естественной среде.

Наиболее результативными корреляционные исследования являются те, в которых собирается большое число данных. Например, при изучении, как и насколько понимают распоряжения начальника его подчиненные. В таком исследовании изучаются личностные качества начальника:

  • уравновешенность;
  • настойчивость;
  • требовательность;
  • оптимизм;
  • дисциплинированность;
  • скромность;
  • доброта;
  • справедливость.

Во время исследования рассматривается зависимость восприятия начальника, понимания его распоряжений от демографических характеристик подчиненных (возраста, пола, семейного положения), а также их статуса в коллективе.

Корреляционный анализ позволяет выявить взаимосвязь между независимыми переменными, на которые психолог никак не влияет. Результаты анализа часто берутся в основу гипотезы дальнейших эмпирических исследований.

4) линейный коэффициент корреляции

Этот коэффициент как раз и оценивает тесноту линейной корреляционной зависимости и более того, указывает её направление (прямая или обратная). Его полное название: выборочный линейный коэффициент пАрной корреляции Пирсона :)

– «выборочный» – потому что мы рассматриваем выборочную совокупность;
– «линейный» – потому что он оценивает тесноту линейной корреляционной зависимости;
– «пАрной» – потому что у нас два признака (бывает хуже);
– и «Пирсона» – в честь английского статистика Карла Пирсона, это он автор понятия «корреляция».

И в зависимости от фантазии автора задачи вам может встретиться любая комбинация этих слов. Теперь нас не застанешь врасплох, Карл.

Линейный коэффициент корреляции вычислим по формуле:, где:  – среднее значение произведения признаков,  – признаков и  – признаков. Числитель формулы имеет особый смысл, о котором я расскажу, когда мы будем разбирать второй способ решения.

Осталось разгрести всё это добро :) Впрочем, все нужные суммы уже рассчитаны в таблице выше. Вычислим средние значения:

Стандартные отклонения найдём как корни из соответствующих :

Таким образом, коэффициент корреляции:

И расшифровка: коэффициент корреляции может изменяться в пределах  и чем он ближе по модулю к единице, тем теснее линейная корреляционная зависимость – тем ближе расположены точки к прямой, тем качественнее и достовернее линейная модель. Если  либо , то речь идёт о строгой линейной зависимости, при которой все эмпирические точки окажутся на построенной прямой. Наоборот, чем ближе  к нулю, тем точки рассеяны дальше, тем линейная зависимость выражена меньше. Однако в последнем случае зависимость всё равно может быть! – например, нелинейной или какой-нибудь более загадочной. Но до этого мы ещё дойдём. А у кого не хватит сил, донесём :)

Для оценки тесноты связи будем использовать уже знакомую шкалу Чеддока:
При этом если , то корреляционная связь обратная, а если , то прямая.

В нашем случае , таким образом, существует сильная обратная линейная корреляционная зависимость  – суммарной успеваемости от  – количества прогулов.

Линейный коэффициент корреляции – это частный аналог . Но в отличие от отношения, он показывает не только тесноту, но ещё и направление зависимости, ну и, конечно, здесь определена её форма (линейная).

Похожие термины:

  • (serial correlation) Ситуация, когда значение переменной стохастического временного ряда не является независимым от значения, которое она имела в предшествующие периоды. Если x(t) – переменная временного р

  • Термин, принятый в статистике для определения степени зависимости между двумя переменными величинами. См. Correlation coefficient.

  • расходование большей пропорции денег на некоторые виды маркетинга с целью повысить эффективность всей программы.

  • (rank correlation) Метод проверки зависимости между двумя переменными с помощью определения корреляции их ранговых порядков. Этот метод может быть использован, если предполагается, что зависимость монот

  • Показатель степени линейной зависимости между двумя переменными величинами: Коэффициент корреляции может изменяться в пределах от +1 до -1. Если большим значениям одной величины соответствуют бол

  • число, показывающее степень тесноты корреляции (связи), измеряемое от (-1) до (+1).

  • характеризует тесноту связи между результатным показателем и набором факторных показателей:

  • математико-статистическая теория, изучающая зависимости вариации признака от окружающих условий.

  • характеризует тесноту связи между результативным показателем и набором факторных показателей.

  • показатель, указывающий на то, какой процент изменения зависимой переменной обусловливается изменениями независимой переменной- Этот показатель варьирует от 0 до 1. Нуль означает, что изменения н

  • величина, рассчитываемая по наблюдениям над двумя случайными величинами и характеризующая степень их связи; отношение ковариации двух случайных величин к произведению их средних квадратических

  • отношение алгебраического дополнения Aij, умноженного на минус единицу, к корню квадратному из произведения алгебраических дополнений элементов rij, и rji матрицы выборочных коэффициентов корреляци

  • (rx. y.z) — используется в анализе хозяйственной деятельности при изучении связи между показателями х и у, когда требуется исключить воздействие третьего показателя z, выступающего как общий фактор

  • (Correlation) — разновидность причинно-следственной связи, когда между изучаемыми признаками нельзя установить, какой из них является причиной, а какой следствием, т.е. причинность имеет скрытый характе

  • соотношение, соответствие, зависимость между двумя случайными переменными, при этом каждому значению одной случайной переменной соответствует определенное условное математическое ожидание (ср

  • Графическое пре дставле н и е дан ных, при котором наблюдаемые значения одной переменной, соответствующие значениям другой переменной, наносятся на график в виде точек, не соединенных линиями. Диа

  • наиболее распространенный метод моделирования взаимосвязи показателей, когда зависимость между ними является стохастической (вероятностной).

  • способ установления линейной зависимости и тесноты связи между параметрами (численностью персонала и влияющими на нее факторами). Математический аппарат К. и р.а. подробно рассматривается в специ

  • раздел математической статистики, изучающий взаимную зависимость случайных величин.

  • Корреляционный риск — риск потерь в результате изменений в корреляции между финансовыми инструментами, валютами или рынками.

Рейтинг
( Пока оценок нет )
Editor
Editor/ автор статьи

Давно интересуюсь темой. Мне нравится писать о том, в чём разбираюсь.

Понравилась статья? Поделиться с друзьями:
Сказка или жизнь
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: