Классическая модель линейной регрессии

Вид работы:

Практическое задание
Предмет:

Эктеория
Язык:

Русский
,
Формат файла:
MS Word

421,87 Кб
Опубликовано:

2015-01-16

Скачать практическое задание Читать текст online Заказать контрольную
*Помощь в написании! Посмотреть все задачи

Вы можете узнать стоимость помощи в написании студенческой работы.

Классическая модель линейной регрессии

Лабораторная работа № 2

Тема "Классическая модель линейной регрессии"

Задания По данным приложения А:

1) рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.

2) дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.

) оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

) оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.

) оцените качество уравнения через среднюю ошибку аппроксимации.

) рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.

) постройте модель в естественной форме только с информативными факторами и оцените ее параметры.

) постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.

9) рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.

10) рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .

) по полученным результатам сделайте экономический вывод.

Реализация типовых заданий

1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.

Имеются данные о деятельности 25 крупнейших компаний США (таблица 8.2.1).

Построим уравнение множественной линейной регрессии следующего вида:

Для этого проведем регрессионный анализ данных факторов с помощью табличного редактора МС Excel.

Таблица 8.2.1 - Исходные данные для проведения корреляционного и регрессионного анализа

№ п/п
1	45,9	34	68	12,5	43,3	2,3
2	46,7	16,1	49,3	18,8	42,9	3,9
3	45,7	7,2	66,6	7	41,3	1,7
4	46,7	12,7	17,3	14,6	40,9	2,6
5	47,6	22,7	78,5	30,7	39,7	3,1
6	46,3	17,7	20,9	28	28,9	0,6
7	49,1	139,8	356,4	100,6	39,4	5,1
8	20,6	72,4	24,8	39,2	2,6
9	51,9	168,1	218,2	216,1	38,7	4,5
10	45,4	4,7	5	1,2	37,7	1,9
11	46,3	9,5	28,8	7,8	37,7	3
12	46,9	29,8	68	12,4	37,4	3,6
13	46,9	16,1	47,5	17,9	28,6	3,7
14	46,4	12,5	45,4	61,5	35,5	2,5
15	45,4	22,2	43,9	30,5	35,1	3,1
16	45,8	9,5	11,5	9,7	34,5	0,3
17	46,8	29,7	46,8	41,2	32,9	2,2
18	45,9	24,8	27,8	32,2	3,5
19	46,1	20,4	54	40,6	27,8	4,1
20	46,9	15,4	42,8	17,2	31,7	4,3
21	44,1	24,1	5,8	38	31,6	2,9
22	46,3	16,2	31	20,5	31,6	3,5
23	47	16,1	41,4	19	31,5	4
24	45,6	6,9	6,8	6,7	30,3	2,6
25	45,7	18,2	20,9	23,4	29,6	4

где y - чистый доход, млрд. долл. x₁ - оборот капитала, млрд. долл. x_{2 -}использованный капитал, млрд. долл. x₃ - численность служащих, тыс. чел. x_{4 -}рыночная капитализация компаний, млрд. долл. x₅ - заработная плата служащих, тыс. долл.

Для построения модели можно воспользоваться инструментом анализа данных Регрессия. Порядок действий следующий:

а) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;

б) заполните диалоговое окно ввода данных и параметров ввода (рисунок 8.2.1):

классическая модель линейная регрессия

Рисунок 8.2.1 - Диалоговое окно ввода параметров инструмента "Регрессия"

Входной интервал Y - диапазон, содержащий данные результативного признака;

Входной интервал Х - диапазон, содержащий данные всех пяти факторов;

Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист - можно задать произвольное имя нового листа.

Результаты регрессионного анализа представлены на рисунке 8.2.2.

Рисунок 8.2.2 - Результат применения инструмента Регрессия для факторов

Составим уравнение множественной регрессии:

Коэффициенты регрессии показывают среднее изменение результативного признака с изменением на 1 единицу своего измерения данного фактора при условии постоянства всех остальных.

Таким образом, коэффициент регрессии при х₁ показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,0136 млрд. долл., при х₂показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,003 млрд. долл., х₃ показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,012 тыс. чел., х₄показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,025 млрд. долл., х₅ показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,07 тыс. долл., при фиксированном значении остальных факторов.

Параметр экономического смысла не имеет.

2. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.

Средние коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора на 1 % от своей средней и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости

где - коэффициент регрессии при в уравнении множественной регрессии.

Результаты вычисления соответствующих показателей для каждого признака представлены на рисунке 8.2.3.

Рисунок 8.2.3 - Результат применения инструмента "Описательная статистика"

Здесь ,

По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат y признаков факторов и , чем признаков факторов , и .

Средний коэффициент эластичности , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,008 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,003 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,009 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,019 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,005 %, при условии, что другие факторы остаются постоянными.

3. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F-критерий Фишера:

Для проверки значимости уравнения выдвигаем две гипотезы:

Н₀: уравнение регрессии статистически не значимо;

Н₁: уравнение регрессии статистически значимо.

По данным таблиц дисперсионного анализа, представленным на рисунке 8.2.2, =11.52. Вероятность случайно получить такое значение F-критерия составляет 0,00003, что не превышает допустимый уровень значимости 5 %; об этом свидетельствует величина P - значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи . =0,00003. > следовательно уравнение регрессии является статистически значимым.

4. Оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.

Выдвигаем две гипотезы: Н₀: коэффициенты регрессии статистически не значим, т.е. равны о; Н₁: коэффициенты регрессии статистически значимы, т.е. отличны от нуля. Значения случайных ошибок параметров с учетом округления равны (рисунок 8.2.2):

Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 8.2.2):

Если значения t-критерия меньше 2,09, можно сделать вывод о неслучайной природе данного значения параметра, т. е о том, что он статистически значим и надежен. T_табл=

5. Оцените качество уравнения через среднюю ошибку аппроксимации.

Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:

Таблица 8.2.2 - Данные для расчета средней ошибки аппроксимации

№ п/п
1	2	3	4
1	45,9	46,58	1,48
2	46,7	46,46	0,52
3	45,7	46,05	0,77
4	46,7	46,12	1,23
5	47,6	46,64	2,01
6	46,3	45,92	0,81
7	49,1	50,04	1,91
8	46,6	0,26
9	51,9	51,34	1,09
10	45,4	45,69	0,64
11	46,3	46,82	1,13
12	46,9	46,47	0,93
13	46,9	46,07	1,77
14	46,4	46,63	0,49
15	45,4	46,41	2,23
16	45,8	45,68	0,25
17	46,8	46,54	0,57
18	45,9	46,18	0,62
19	46,1	46,43	0,71
20	46,9	46,16	1,58
21	44,1	46,36	5,12
22	46,3	46,11	0,40
23	47	46,16	1,79
24	45,6	45,65	0,12
25	45,7	46,13	0,94
	1164,00	29,38

Таким образом, фактические значения результативного признака отличаются от теоретических значений на 117,5 %. Следовательно, построенная модель не является удовлетворительной.

i. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.

Парные коэффициенты корреляции рассчитываются по формулам:

; .

Рисунок 8.2.4 - Матрица коэффициентов парной корреляции

Из матрицы можно заметить, что факторы и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,7. Таким образом, можно сказать, что они дублируют друг друга.

При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: и .

Построим новое уравнение множественной регрессии с информативными факторами.

7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.

Построим уравнение множественной линейной регрессии следующего вида:

Параметры вычисляем аналогично пункту 1 (рисунок 8.2.7).

Рисунок 8.2.7 - Результат применения инструмента "Регрессия"

Получаем уравнение следующего вида: .

Уравнение в целом, а также его параметры являются статистически значимыми.

8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.

Уравнение в стандартизованном масштабе имеет вид:

Расчет β - коэффициентов выполним по формулам

; .

Парные коэффициенты корреляции берутся из матрицы (рисунок 8.2.6):

Получим уравнение .

Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на 1 сигму при неизменном среднем уровне других факторов.

В нашем случае, при увеличении использования капитала на 1 сигму чистый доход увеличится на 1,07 сигм, при условии, что численность служащих остаются на прежнем уровне, при увеличении использования капитала на 1 сигму чистый доход уменьшится на 0,46 сигм, при условии, что численность служащих остаются на прежнем уровне.

9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.

Рассчитаем ожидаемое прогнозное значение чистого дохода как точечный прогноз путем подстановки в уравнение регрессии прогнозные значения факторов:

1) найдем максимальное значение для фактора (рисунок 8.2.4):

) найдем максимальное значение для фактора (рисунок 8.2.4):

) найдем прогнозные значения факторов:

для фактора :

4) подставим прогнозные значения факторов в уравнение

В результате получим:

Таким образом, при прогнозных значениях использованного капитала 356 млдр. долл. и численности служащих 216,1 тыс. чел. чистый доход крупнейших компаний США составит 92,21 млрд. долл.

Классическая модель линейной регрессии