Классическая модель линейной регрессии
Лабораторная
работа № 2
Тема
"Классическая модель линейной регрессии"
Задания По данным приложения А:
1) рассчитайте параметры линейного уравнения
множественной регрессии с полным перечнем факторов по данным о деятельности
крупнейших компаний США в 2007 г.
2) дайте сравнительную оценку силы связи факторов с
результатом с помощью средних (общих) коэффициентов эластичности.
) оцените с помощью F-критерия Фишера -
Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
) оцените статистическую значимость коэффициентов
регрессии с помощью t - критерия Стьюдента.
) оцените качество уравнения через среднюю ошибку
аппроксимации.
) рассчитайте матрицу парных коэффициентов корреляции
и отберите информативные факторы в модели. Укажите коллинеарные факторы.
) постройте модель в естественной форме только с
информативными факторами и оцените ее параметры.
) постройте модель в стандартизованном масштабе и
проинтерпретируйте ее параметры.
9) рассчитайте прогнозное значение
результата, если прогнозное значение факторов составляют 80% от их максимальных
значений.
10) рассчитайте ошибки и доверительный интервал прогноза для
уровня значимости .
) по полученным результатам сделайте экономический вывод.
Реализация
типовых заданий
1. Рассчитайте параметры линейного уравнения
множественной регрессии с полным перечнем факторов по данным о деятельности
крупнейших компаний США в 2007 г.
Имеются данные о деятельности 25 крупнейших компаний США
(таблица 8.2.1).
Построим уравнение множественной линейной регрессии
следующего вида:
.
Для этого проведем регрессионный анализ данных факторов с помощью
табличного редактора МС Excel.
Таблица 8.2.1 - Исходные данные для проведения
корреляционного и регрессионного анализа
№ п/п
|
|
|
|
|
|
|
1
|
45,9
|
34
|
68
|
12,5
|
43,3
|
2,3
|
2
|
46,7
|
16,1
|
49,3
|
18,8
|
42,9
|
3,9
|
3
|
45,7
|
7,2
|
66,6
|
7
|
41,3
|
1,7
|
4
|
46,7
|
12,7
|
17,3
|
14,6
|
40,9
|
2,6
|
5
|
47,6
|
22,7
|
78,5
|
30,7
|
39,7
|
3,1
|
6
|
46,3
|
17,7
|
20,9
|
28
|
28,9
|
0,6
|
7
|
49,1
|
139,8
|
356,4
|
100,6
|
39,4
|
5,1
|
8
|
20,6
|
72,4
|
24,8
|
39,2
|
2,6
|
9
|
51,9
|
168,1
|
218,2
|
216,1
|
38,7
|
4,5
|
10
|
45,4
|
4,7
|
5
|
1,2
|
37,7
|
1,9
|
11
|
46,3
|
9,5
|
28,8
|
7,8
|
37,7
|
3
|
12
|
46,9
|
29,8
|
68
|
12,4
|
37,4
|
3,6
|
13
|
46,9
|
16,1
|
47,5
|
17,9
|
28,6
|
3,7
|
14
|
46,4
|
12,5
|
45,4
|
61,5
|
35,5
|
2,5
|
15
|
45,4
|
22,2
|
43,9
|
30,5
|
35,1
|
3,1
|
16
|
45,8
|
9,5
|
11,5
|
9,7
|
34,5
|
0,3
|
17
|
46,8
|
29,7
|
46,8
|
41,2
|
32,9
|
2,2
|
18
|
45,9
|
24,8
|
27,8
|
32,2
|
3,5
|
19
|
46,1
|
20,4
|
54
|
40,6
|
27,8
|
4,1
|
20
|
46,9
|
15,4
|
42,8
|
17,2
|
31,7
|
4,3
|
21
|
44,1
|
24,1
|
5,8
|
38
|
31,6
|
2,9
|
22
|
46,3
|
16,2
|
31
|
20,5
|
31,6
|
3,5
|
23
|
47
|
16,1
|
41,4
|
19
|
31,5
|
4
|
24
|
45,6
|
6,9
|
6,8
|
6,7
|
30,3
|
2,6
|
25
|
45,7
|
18,2
|
20,9
|
23,4
|
29,6
|
4
|
где y - чистый доход, млрд. долл. x1 - оборот капитала, млрд.
долл. x2 - использованный капитал, млрд. долл. x3 - численность служащих,
тыс. чел. x4 - рыночная капитализация компаний, млрд. долл. x5 - заработная плата
служащих, тыс. долл.
Для построения модели можно воспользоваться инструментом
анализа данных Регрессия. Порядок действий следующий:
а) в главном меню выберите Сервис/Анализ данных/Регрессия.
Щелкните по кнопке ОК;
б) заполните диалоговое окно ввода данных и параметров ввода
(рисунок 8.2.1):
классическая модель линейная регрессия
Рисунок 8.2.1 - Диалоговое окно ввода параметров инструмента
"Регрессия"
Входной интервал Y - диапазон, содержащий
данные результативного признака;
Входной интервал Х - диапазон, содержащий
данные всех пяти факторов;
Метки - флажок, который указывает, содержит ли первая
строка названия столбцов или нет;
Константа - ноль - флажок, указывающий на
наличие или отсутствие свободного члена в уравнении;
Выходной интервал - достаточно указать
левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать
произвольное имя нового листа.
Результаты регрессионного анализа представлены на рисунке
8.2.2.
Рисунок 8.2.2 - Результат применения инструмента Регрессия
для факторов
Составим уравнение множественной регрессии:
Коэффициенты регрессии показывают среднее изменение результативного
признака с изменением на 1 единицу своего измерения данного фактора при условии
постоянства всех остальных.
Таким образом, коэффициент регрессии при х1 показывает,
что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится
в среднем на 0,0136 млрд. долл., при х2 показывает, что с
увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в
среднем на 0,003 млрд. долл., х3 показывает, что с увеличением
оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,012
тыс. чел., х4 показывает, что с увеличением оборотного капитала на 1
млрд. долл. чистый доход увеличится в среднем на 0,025 млрд. долл., х5
показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход
увеличится в среднем на 0,07 тыс. долл., при фиксированном значении остальных
факторов.
Параметр экономического смысла не имеет.
2. Дайте сравнительную оценку силы связи факторов с
результатом с помощью средних (общих) коэффициентов эластичности.
Средние коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении
фактора на 1 % от своей средней и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии.
Для линейной зависимости
,
где - коэффициент регрессии при в уравнении множественной регрессии.
Результаты вычисления соответствующих показателей для каждого
признака представлены на рисунке 8.2.3.
Рисунок 8.2.3 - Результат применения инструмента
"Описательная статистика"
Здесь ,
,
,
,
.
По значениям средних коэффициентов эластичности можно сделать
вывод о более сильном влиянии на результат y признаков факторов и , чем признаков факторов , и .
Средний коэффициент эластичности , показывает, что с увеличением оборотного капитала на 1 %, чистый
доход увеличивается в среднем на 0,008 %, при условии, что другие факторы
остаются постоянными, , показывает, что с увеличением оборотного
капитала на 1 %, чистый доход увеличивается в среднем на 0,003 %, при условии,
что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый
доход увеличивается в среднем на 0,009 %, при условии, что другие факторы
остаются постоянными, , показывает, что с увеличением оборотного
капитала на 1 %, чистый доход увеличивается в среднем на 0,019 %, при условии,
что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый
доход увеличивается в среднем на 0,005 %, при условии, что другие факторы
остаются постоянными.
3. Оцените с помощью F-критерия Фишера-Снедекора значимость
уравнения линейной регрессии и показателя тесноты связи.
Оценку надежности уравнения регрессии в целом и показателя тесноты
связи дает F-критерий Фишера:
.
Для проверки значимости уравнения выдвигаем две гипотезы:
Н0: уравнение регрессии статистически не значимо;
Н1: уравнение регрессии статистически значимо.
По данным таблиц дисперсионного анализа, представленным на рисунке
8.2.2, =11.52. Вероятность случайно получить
такое значение F-критерия составляет 0,00003, что не
превышает допустимый уровень значимости 5 %; об этом свидетельствует величина P - значение из этой же таблицы. Следовательно, полученное
значение не случайно, оно сформировалось под влиянием существенных факторов,
т.е. подтверждается статистическая значимость всего уравнения и показателя
тесноты связи . =0,00003. > следовательно уравнение регрессии является статистически
значимым.
4. Оцените статистическую значимость
коэффициентов регрессии с помощью t - критерия Стьюдента.
Выдвигаем две гипотезы: Н0: коэффициенты регрессии статистически
не значим, т.е. равны о; Н1: коэффициенты регрессии статистически
значимы, т.е. отличны от нуля. Значения случайных ошибок параметров с учетом округления равны (рисунок
8.2.2):
Они показывают, какое значение данной характеристики
сформировались под влиянием случайных факторов. Эти значения используются для
расчета t-критерия Стьюдента (рисунок 8.2.2):
.
Если значения t-критерия
меньше 2,09, можно сделать вывод о неслучайной природе данного значения
параметра, т. е о том, что он статистически значим и надежен. Tтабл=
5. Оцените качество уравнения через среднюю ошибку
аппроксимации.
Рассчитаем среднюю ошибку аппроксимации по формуле средней
арифметической простой:
Таблица 8.2.2 - Данные для расчета средней ошибки аппроксимации
№ п/п
|
|
|
|
1
|
2
|
3
|
4
|
1
|
45,9
|
46,58
|
1,48
|
2
|
46,7
|
46,46
|
0,52
|
3
|
45,7
|
46,05
|
0,77
|
4
|
46,7
|
46,12
|
1,23
|
5
|
47,6
|
46,64
|
2,01
|
6
|
46,3
|
45,92
|
0,81
|
7
|
49,1
|
50,04
|
1,91
|
8
|
46,6
|
0,26
|
9
|
51,9
|
51,34
|
1,09
|
10
|
45,4
|
45,69
|
0,64
|
11
|
46,3
|
46,82
|
1,13
|
12
|
46,9
|
46,47
|
0,93
|
13
|
46,9
|
46,07
|
1,77
|
14
|
46,4
|
46,63
|
0,49
|
15
|
45,4
|
46,41
|
2,23
|
16
|
45,8
|
45,68
|
0,25
|
17
|
46,8
|
46,54
|
0,57
|
18
|
45,9
|
46,18
|
0,62
|
19
|
46,1
|
46,43
|
0,71
|
20
|
46,9
|
46,16
|
1,58
|
21
|
44,1
|
46,36
|
5,12
|
22
|
46,3
|
46,11
|
0,40
|
23
|
47
|
46,16
|
1,79
|
24
|
45,6
|
45,65
|
0,12
|
25
|
45,7
|
46,13
|
0,94
|
|
1164,00
|
29,38
|
Таким образом, фактические значения результативного признака
отличаются от теоретических значений на 117,5 %. Следовательно, построенная
модель не является удовлетворительной.
i. Рассчитайте матрицу парных коэффициентов
корреляции и отберите информативные факторы в модели. Укажите коллинеарные
факторы.
Значения линейных коэффициентов парной корреляции определяют
тесноту попарно связанных переменных, использованных в данном уравнении множественной
регрессии.
Парные коэффициенты корреляции рассчитываются по формулам:
; .
Рисунок 8.2.4 - Матрица коэффициентов парной корреляции
Из матрицы можно заметить, что факторы и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,7.
Таким образом, можно сказать, что они дублируют друг друга.
При отборе факторов в модель предпочтение отдается фактору,
который при достаточно тесной связи с результатом имеет наименьшую тесноту
связи с другими факторами. В нашем примере получаем, информативными факторами
являются: и .
Построим новое уравнение множественной регрессии с информативными
факторами.
7. Постройте модель в естественной форме только с
информативными факторами и оцените ее параметры.
Построим уравнение множественной линейной регрессии следующего
вида:
.
Параметры вычисляем аналогично пункту 1 (рисунок 8.2.7).
Рисунок 8.2.7 - Результат применения инструмента
"Регрессия"
Получаем уравнение следующего вида: .
Уравнение в целом, а также его параметры являются статистически
значимыми.
8. Постройте модель в стандартизованном масштабе и
проинтерпретируйте ее параметры.
Уравнение в стандартизованном масштабе
имеет вид:
.
Расчет β -
коэффициентов выполним по формулам
; .
Парные коэффициенты корреляции берутся из матрицы (рисунок 8.2.6):
Получим уравнение .
Стандартизованные коэффициенты регрессии показывают, на
сколько сигм изменится в среднем результативный признак, если соответствующий
фактор изменится на 1 сигму при неизменном среднем уровне других факторов.
В нашем случае, при увеличении использования капитала на 1
сигму чистый доход увеличится на 1,07 сигм, при условии, что численность
служащих остаются на прежнем уровне, при увеличении использования капитала на 1
сигму чистый доход уменьшится на 0,46 сигм, при условии, что численность
служащих остаются на прежнем уровне.
9. Рассчитайте прогнозное
значение результата, если прогнозное значение факторов составляют 80% от их
максимальных значений.
Рассчитаем ожидаемое прогнозное значение
чистого дохода как точечный прогноз путем подстановки в уравнение регрессии
прогнозные значения факторов:
1) найдем максимальное значение для фактора (рисунок 8.2.4):
) найдем максимальное значение для фактора (рисунок 8.2.4):
) найдем прогнозные значения факторов:
для фактора :
для фактора :
4) подставим прогнозные значения
факторов в уравнение
В результате получим:
Таким образом, при прогнозных значениях использованного капитала
356 млдр. долл. и численности служащих 216,1 тыс. чел. чистый доход крупнейших
компаний США составит 92,21 млрд. долл.