Math |
Высшая Mатематика Решение задач и примеров - OnLine
|
./ Главная /Корреляция, ковариация, линейная регрессия, ШАГ-1/Пример > |
Пример вычисления корреляции, построения линейной регрессии и проверки гипотезы зависимости двух СВ нашим сервисом:Задача: Имеется связанная выборка из 26 пар значений (хk,yk):
- коэффициент корреляции; - проверить гипотезу зависимости случайных величин X и Y, при уровне значимости α = 0.05 ; - коэффициенты уравнения линейной регрессии; - диаграмму рассеяния (корреляционное поле) и график линии регрессии; РЕШЕНИЕ: 1. Вычисляем коэффициент корреляции.Коэффициент корреляции — это показатель взаимного вероятностного влияния двух случайных величин.
Коэффициент корреляции R может принимать значения от -1 до +1. Если абсолютное значение находится ближе к 1,
то это свидетельство сильной связи между величинами, а если ближе к 0 — то, это говорит о слабой связи или ее отсутствии. Если абсолютное значение
R равно единице, то можно говорить о функциональной связи между величинами, то есть одну величину можно
выразить через другую посредством математической функции. Вычислить коэффициент корреляции можно по следующим формулам:
На практике, для вычисления коэффициента корреляции чаще используется формула ( 1.4 )
т.к. она требует меньше вычислений. Однако если предварительно была вычислена ковариация cov(X,Y), то выгоднее использовать
формулу ( 1.1 ), т.к. кроме собственно значения ковариации можно воспользоваться и результатами промежуточных вычислений. 1.1 Вычислим коэффициент корреляции по формуле ( 1.4 ), для этого
вычислим значения xk2, yk2 и xkyk
и занесем их в таблицу 1. Таблица 1
1.2. Вычислим Mx по формуле ( 1.5 ). 1.2.1. Сложим последовательно все элементы xk x1 + x2 + … + x26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000 1.2.2. Разделим полученную сумму на число элементов 669.50000 / 26 = 25.75000 Mx = 25.750000 1.3. Аналогичным образом вычислим My. 1.3.1. Сложим последовательно все элементы yk y1 + y2 + … + y26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000 1.3.2. Разделим полученную сумму на число элементов выборки 793.00000 / 26 = 30.50000 My = 30.500000 1.4. Аналогичным образом вычислим Mxy. 1.4.1. Сложим последовательно все элементы 6-го столбца таблицы 1 776.16000 + 776.16000 + ... + 794.64000 = 20412.830000 1.4.2. Разделим полученную сумму на число элементов 20412.83000 / 26 = 785.10885 Mxy = 785.108846 1.5. Вычислим значение Sx2 по формуле ( 1.6. ). 1.5.1. Сложим последовательно все элементы 4-го столбца таблицы 1 635.04000 + 696.96000 + ... + 665.64000 = 17256.910000 1.5.2. Разделим полученную сумму на число элементов 17256.91000 / 26 = 663.72731 1.5.3. Вычтем из последнего числа квадрат величины Mx получим значение для Sx2 Sx2 = 663.72731 - 25.750002 = 663.72731 - 663.06250 = 0.66481 1.6. Вычислим значение Sy2 по формуле ( 1.6. ). 1.6.1. Сложим последовательно все элементы 5-го столбца таблицы 1 948.64000 + 864.36000 + ... + 948.64000 = 24191.840000 1.6.2. Разделим полученную сумму на число элементов 24191.84000 / 26 = 930.45538 1.6.3. Вычтем из последнего числа квадрат величины My получим значение для Sy2 Sy2 = 930.45538 - 30.500002 = 930.45538 - 930.25000 = 0.20538 1.7. Вычислим произведение величин Sx2 и Sy2. Sx2Sy2 = 0.66481 • 0.20538 = 0.136541 1.8. Извлечем и последнего числа квадратный корень, получим значение SxSy. SxSy = 0.36951 1.9. Вычислим значение коэффициента корреляции по формуле (1.4.). R = ( 785.10885 - 25.75000 • 30.50000) / 0.36951 = ( 785.10885 - 785.37500) / 0.36951 = -0.72028 ОТВЕТ: Rx,y = -0.720279 2. Проверяем значимость коэффициента корреляции (проверяем гипотезу зависимости).Поскольку оценка коэффициента корреляции вычислена на конечной выборке, и поэтому может отклоняться от своего генерального значения,
необходимо проверить значимость коэффициента корреляции. Проверка производится с помощью t-критерия:
Случайная величина t следует t-распределению Стьюдента
и по таблице t-распределения необходимо найти критическое значение критерия (tкр.α) при заданном уровне
значимости α. Если вычисленное по формуле ( 2.1 ) t по модулю окажется меньше
чем tкр.α, то зависимости между случайными величинами X и Y нет. В противном случае, экспериментальные
данные не противоречат гипотезе о зависимости случайных величин. 2.1. Вычислим значение t-критерия по формуле ( 2.1 ) получим:
2.2. Определим по таблице t-распределения критическое значение параметра tкр.α Искомое значение tкр.α располагается на пересечении строки соответствующей числу степеней свободы и столбца соответствующего заданному уровню значимости α. В нашем случае число степеней свободы есть n - 2 = 26 - 2 = 24 и α = 0.05 , что соответствует критическому значению критерия tкр.α = 2.064 (см. табл. 2) Таблица 2 t-распределение
2.2. Сравним абсолютное значение t-критерия и tкр.α Абсолютное значение t-критерия не меньше критического t = 5.08680, tкр.α = 2.064, следовательно экспериментальные данные, с вероятностью 0.95 ( 1 - α ), не противоречат гипотезе о зависимости случайных величин X и Y. 3. Вычисляем коэффициенты уравнения линейной регрессии.Уравнение линейной регрессии представляет собой уравнение прямой, аппроксимирующей (приблизительно описывающей) зависимость
между случайными величинами X и Y. Если считать, что величина X свободная, а Y зависимая от Х, то уравнение регрессии запишется следующим образом Y = a + b•X ( 3.1 ), где:
Рассчитанный по формуле ( 3.2 ) коэффициент b называют коэффициентом линейной регрессии. В некоторых источниках
a называют постоянным коэффициентом регрессии и b соответственно переменным. Погрешности предсказания Y по заданному значению X вычисляются по формулам :
Sy / Sx = 0.55582 3.3 Вычислим коэффициент b по формуле ( 3.2 ) b = -0.72028 • 0.55582 = -0.40035 3.4 Вычислим коэффициент a по формуле ( 3.3 ) a = 30.50000 - ( -0.40035 • 25.75000) = 40.80894 3.5 Оценим погрешности уравнения регрессии. 3.5.1 Извлечем из Sy2 квадратный корень получим:
3.5.2 Возведем в квадрат Rx,y получим: R2x,y = -0.720282 = 0.51880 3.5.3 Вычислим абсолютную погрешность (остаточное среднее квадратическое отклонение) по формуле ( 3.4 )
3.5.4 Вычислим относительную погрешность по формуле ( 3.5 ) δy/x = ( 0.31437 / 30.50000)100% = 1.03073%
4. Строим диаграмму рассеяния (корреляционное поле) и график линии регрессии.Диаграмма рассеяния — это графическое изображение соответствующих пар (xk , yk ) в виде точек плоскости, в прямоугольных координатах с осями X и Y. Корреляционное поле является одним из графических представлений связанной (парной) выборки. В той же системе координат строится и график линии регрессии. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы диаграмма была максимально наглядной.4.1. Находим минимальный и максимальный элемент выборки X это 18-й и 15-й элементы соответственно, xmin = 22.10000 и xmax = 26.60000. 4.2. Находим минимальный и максимальный элемент выборки Y это 2-й и 18-й элементы соответственно, ymin = 29.40000 и ymax = 31.60000. 4.3. На оси абсцисс выбираем начальную точку чуть левее точки x18 = 22.10000, и такой масштаб, чтобы на оси поместилась точка x15 = 26.60000 и отчетливо различались остальные точки. 4.4. На оси ординат выбираем начальную точку чуть левее точки y2 = 29.40000, и такой масштаб, чтобы на оси поместилась точка y18 = 31.60000 и отчетливо различались остальные точки. 4.5. На оси абсцисс размещаем значения xk, а на оси ординат значения yk. 4.6. Наносим точки (x1, y1 ), (x2, y2 ),…,(x26, y26 ) на координатную плоскость. Получаем диаграмму рассеяния (корреляционное поле), изображенное на рисунке ниже. 4.7. Начертим линию регрессии. Для этого найдем две различные точки с координатами (xr1 , yr1) и (xr2 , yr2) удовлетворяющие уравнению (3.6), нанесем их на координатную плоскость и проведем через них прямую. В качестве абсциссы первой точки возьмем значение xmin = 22.10000. Подставим значение xmin в уравнение (3.6), получим ординату первой точки. Таким образом имеем точку с координатами ( 22.10000, 31.96127 ). Аналогичным образом получим координаты второй точки, положив в качестве абсциссы значение xmax = 26.60000. Вторая точка будет: ( 26.60000, 30.15970 ). Линия регрессии показана на рисунке ниже красным цветом ![]() см. пример с ковариацией... решить мою задачу... на ввод условия... к списку решаемых задач... | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() ![]() |