Материал: Економетрія - Навчальний посібник ( Лугінін О.Є.)


6.8. значимість коефіцієнта кореляції та оцінок параметрів моделі множинної регресії

У кореляційному аналізі для характеристики відхилень коефіцієнта кореляції, як вибіркової величини, від свого "істотного" значення вимагається перевірка його значимості за ї-критерієм Ст'юдента:

ї =   }   21 , (6.40)

л/1 Я2

де Я2 коефіцієнт детермінації моделі; Я коефіцієнт кореляції';(я-да1) число ступенів вільності.

Розраховане за формулою (6.40) фактичне значення ї-критерію зіставляється з табличним значенням їтабл.. Останнє обирається за статистичними таблицями на підставі прийнятого рівня значимості а та розрахованого числа ступеней вільності (п-т1). Якщо їсО>їтабл, то можна зробити висновок про значимість коефіцієнта кореляції між змінними.

У  кореляційному  аналізі  може  перевірятись також

значимість оцінок параметрів моделі А із знаходженням їх довірчих інтервалів.

Припустивши, що залишки и розподілені за нормальним

законом, приймається, що параметри моделі А також задовольняють нормальному розподілу. Тоді перевірку гіпотези про значимість оцінок параметрів моделі проводять згідно з ї-критерієм Ст'юдента:

*іа=^=, (6.41) 4аиСЦ

де а індивідуальні параметри матриці А(у = 1...т1); сг2 -дисперсія залишків; с^ діагональний елемент матриці (X'X) 1; Ба = А'стіс^ - стандартна помилка оцінки параметра моделі.

Обчислене значення ^-критерію порівнюється з табличним ітабл. при вибраному рівні значимості а і (п-т1) ступенях вільності. Якщо іа>ітабл,, то оцінка значимості відповідного параметру моделі є достовірною.

На    підставі    ґ-критерію    і    стандартної помилки встановлюються довірчі інтервали для параметра а у:

 

ау ~іау[^с~< ау < ау + іа^ої^. (6.42) Коли    стандартні    помилки    параметрів 5

 

 

не

 

перевищують абсолютні значення цих параметрів а у, то це

може означати, що оцінки параметрів є незміщеними відносно їх істотних значень.

Приклад 6.3 [28]. Побудувати економетричну модель множинної регресії, яка описує зв'язок між тижневими витратами на харчування, загальними витратами та розміром сім'ї. Оцінити тісноту та значимість зв'язку між змінними та параметрами моделі. Дані обстеження сімей наведені у таблиці:

 

№ з/п

Витрати на харчування, г.о.

Загальні витрати, г.о

Розмір сім'ї (кількість)

1

2

3

4

1

22

45

1,5

2

34

75

1,6

3

50

125

1,9

4

67

223

1,8

5

47

92

3,4

6

66

146

3,6

7

81

227

3,4

8

106

358

3,5

9

70

135

5,5

10

95

218

5,4

11

119

331

5,4

12

147

490

5,3

13

93

175

8,5

14

133

305

8,3

15

169

468

8,1

16

197

749

7,3

Розрахувати точковий та індивідуальний прогнози математичного сподівання індивідуального значення залежної змінної,   коли   для   прогнозного   періоду   відомий вектор

' 1 >

 

Х0 =

500 6

 

 

7

 

 

 

Розв'язання

 

Ідентифікуємо змінні:

У витрати на харчування (залежна змінна);

X (х1, х2) незалежні змінні: х1 загальні витрати, г.о.; х2 розмір сім'ї (кількість членів сім'ї).

Практикою спостережень, наприклад, встановлено, що дана модель може бути специфікована у лінійній формі:

 

и;

 

де У, У відповідно фактичні та розрахункові значення тижневих витрат на харчування за моделлю; и залишки; а0, а1, а2 оцінка параметрів моделі.

Оператор оцінки параметрів моделі ау при використанні 1МНК має вигляд (6.3):

 

А — (X 'X )_1 X У,

 

 

 

 

де

 

А ■

0

V $2 )

 

X' матриця, транспонована до X.

Одиниця в матриці незалежних змінних X дописується тоді, коли економетрична модель має вільний член а0 (як у нашому випадку).

Згідно з оператором оцінювання обчисляємо матриці: (16       416,2      74,5 > 1)(Х'X) — 416,2   1 601562 23271 74,5    23271     436,7

 

 

2 ) (X X ) ■■

0,314   0,0017   0,0446

0,0017    0,00003 0,00012

0 0446 0 00012   0 0165

 

 

 

4495 520090

8368

 

7

 

0,2 6,97

 

Отже, економетрична модель множинної регресії для тижневих витрат на харчування запишеться так:

Т = 8,8 + 0,2 х1 + 6,97 х2.

Зробимо економетричні висновки.

Коли за всіх однакових умов незалежна змінна хі (загальні витрати) змінюється (збільшується або зменшується)

на одиницю, то залежна змінна Т змінюється на 0,2 одиниць. Якщо при тих же умовах незалежна змінна х2 (розмір сім'ї)

змінюється на одиницю, то залежна змінна Т змінюється на 6,97 одиниць.

Визначимо   множинні   коефіцієнти   детермінації та кореляції: Таблиця 6.15

№ з/п

т

Т

(Т Т )2

(Т Т )2

є =

= Т Т

є2 =

= (Т Т )2

1

2

3

4

5

6

7

1

22

20,3

4225

4007

1,7

2,89

2

34

27,0

3399

2632

7

49

3

50

39,0

2144

1246

11

121

4

67

58,0

745

335

9

81

5

47

42,9

1798

1467

4,1

16,81

6

66

55,1

918

372

10,9

118,8

7

81

69,9

237

18,5

11,1

123,2

8

106

96,8

132.2

428

9,2

84,6

9

70

66,1

369

234

3,9

15,21

10

95

82,0

10,9

94,1

13

169

11

119

104,6

372

1136

14,4

207,4

12

147

131,7

2540

3807

11,3

127,7

13

93

95,0

94,1

59,3

-2

4

14

133

119,6

1176

2275

13,4

179,6

15

169

150,8

4267

7006

18,2

331,2

16

197

202,0

13519

12477

-5

25

І

 

1364,8

35940

37594

-

1656,4

У середньому

 

85,3

-

-

-

-

Визначимо коефіцієнти детермінації та кореляції, якщо (и-1)=(16-1)=15 і (п-»ц)=(16-3)=13:

Я2 _ 1 16564 * — = 0,950; Я _ 0,975. 37594 3

Коефіцієнти детермінації та кореляції наближені до одиниці, тому зв'язок між змінними X та У тісний. Значення коефіцієнта витрат на харчування на 95\% визначається варіаціями загальних витрат та розміром сім'ї, а 5\% припадає на невраховані фактори.

Визначимо значимість зв'язку між змінними X та У за допомогою Е-критерію Фішера (6.26): 16 _

У (у у )2

Е_к      *   _ з5940*!3=1410

у(у-У)2 т -1  1656,4 2     ' •

Обчислене фактичне значення критерія Фішера Е порівнюється з табличним Ртавл. (див. додаток А). При ступенях вільності чисельника ( т1-1)=(3-1)=2 та знаменника (п-т1)=(16-3)=13 і прийнятому рівню довіри (1-о)=(1-0,05)=0,95 Ртабл для розглянутої моделі дорівнює ЕтабЛ=3,81. Так як Р>Ртабл (141,0>3,81), то це означає значимість зв'язку в економетричній моделі.

Для перевірки значимісті коефіцієнта кореляції Я розраховуємо т-критерій Ст'юдента:

_ Яуіп т1 _ 0,975 * у[І3 _ 0,975 * 3,61 _ ^

" _ Л-Я2   " л/1 0,950 "    0,224    "   ' '

З використанням статистичних таблиць (додаток Б) при рівні значимості а=0,05 та числу ступенів вільності (п-т1)=(16-3)=13 вибираємо ?табл.=1,771.

Оскільки іа>їтабл., то можна зробити висновок про значимість коефіцієнта кореляції.

Для оцінки значимості оцінок параметрів моделі множинної регресії обчислимо ^-критерій. Дисперсія залишок дорівнює

я -да1 13

Тоді з урахуванням стандартної помилки оцінки параметрів розраховуєм значення 3-критеріїв:

3 Іа°І 8,8 -М. -1392 1а        7127,4*0,314   6,32    ' '

3   -     Iа!     -  0,2       -_°2_ 3242й   7а2*С2Г   7127,4*0,00003   0,0618    ' '

3 -  N  -    6,97    -б,9?-481

3й   л/а'* с33    7127,4*0,0165    1,45     ' '

Вище було визначене табличне значення 3-критерію 3табл=1,771. Порівняння розрахованих та табличного значень 3-критеріїв приводить до такого: 3іа<3табл, що свідчить про нестійкість впливу змінної X] на результативну ознаку У; І2а>3табл. та 3за>3табл., що показує істотний зв'язок цих залежних змінних (х2, х3) на залежну У.

На    основі    3-критеріїв    та    стандартної помилки

$аі а/о2 су можуть бути визначені довірчі інтервали для параметрів моделі:

 

8,8 -1,392 * 6,32 < а0 < 8,8 +1,392 * 6,32, 0,003 < а0 < 17,60;

 

0,2 3,24 * 0,0618 < а1 < 0,2 + 3,24 * 0,0618, 0 < а1 < 0,4;

 

6,97 4,81* 1,45 < а2 < 6,97 + 4,81* 1,45, 0 < а2 < 13,94.

Так як значення стандартних помилок не перевищують абсолютні значення оцінок параметрів ау, то це

означає, що оцінки параметрів є незміщеними.

Нарешті, побудуємо точковий та інтервальний прогнози для економетричної моделі.

Визначимо прогнозне значення залежної змінної при

' 1 '

 

Х0 =

500 6

;

Y0 = 8,8 + 0,2 ô1 + 6,97 ô2 = 8,8 + 0,2 * 500 + 6,97 *6 = 150,6.

Тоді M(Y0) можна розглядати як оцінку прогнозного значення математичного сподівання та індивідуального значення витрат на харчування при відомих загальних витратах х1 та розміру сім'ї х2.

Получимо інтервальний прогноз математичного сподівання M(Y0).

Визначимо для цього дисперсію прогнозну       (6.28) з

урахуванням матриці похибок (X'X)~', яка для розглядаємого прикладу має наведений вигляд:

(X 'X)0,314   0,0017   0,0446 > -0,0017    0,00003 0,0012 ■0,0446 - 0,00012    0,0165

Елементи дисперсійно-коваріаційної матриці за формулами (6.30) мають значення:

а2аі =а2* пп = 127,4*0,314 = 40;

а2г =а2* п22 = 127,4*0,00003 = 0,00382;

а23 =а* п33 = 127,4*0,0165 = 2,10;

^2 = п21 =а2* п12 =-127,4*0,0017 = -0,216;

п13 = п31 =о2* п13 =-127,4*0,0446 = -5,68;

п23 = п32 =а<2* п23 =-127,4*0,00012 = -0,01529.

Тоді дисперсіно-коваріаційна матриця запишеться у

вигляді:

 

 

var(A):

г 40      - 0,216     5,68 > -0,216   0,00382  -0,01529

 

5,68 0,01529 2,10

500 6

500 6

Знайдемо дисперсію помилок: f 1 Y 40      0,216     - 5,68     Y 1 > -0,216   0,00382  -0,01529