(1.7)
Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием и дисперсией . Поэтому вначале строят доверительный интервал для M(z), а затем делают обратное
z-преобразование.
Применяя z-преобразование для найденного коэффициента корреляции, получим
.
Доверительный интервал для M(z) будет иметь вид
, (1.8)
где t находится с помощью функции Лапласа (t)=/2. Для =0,95 имеем t=1,96. Тогда
,
или
.
Обратное z-преобразование осуществляется по формуле
(1.9)
В результате находим
.
В указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции .
2. Таким образом, между переменными x и y имеет существенная корреляционная зависимость. Будем считать, что эта зависимость является линейной. Модель парной линейной регрессии имеет вид
, (1.10)
где y – зависимая переменная (результативный признак), x – независимая (объясняющая) переменная, – случайные отклонения, 0 и 1 – параметры регрессии. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:
, (1.11)
где b0 и b1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК). В соответствие с МНК, сумма квадратов отклонений фактических значений зависимой переменной y от теоретических была минимальной:
, (1.12)
где – отклонения yi от оцененной линии регрессии. Необходимым условием существования минимума функции двух переменных (1.12) является равенство нулю ее частных производных по неизвестным параметрам b0 и b1. В результате получаем систему нормальных уравнений:
(1.13)
Решая систему (1.13) , найдем