Материал: Економетрія - Навчальний посібник ( Лугінін О.Є.)


7.3. поняття гомоі гетероскедастичності

 

Однією з чотирьох необхідних умов для застосування 1МНК при оцінюванні параметрів економетричної моделі (див. другу умову п. 6.2) є вимоги постійної дисперсії залишків для

кожного спостереження, тобто М(ии') (УиЕ. Ця властивість незмінної дисперсії в спостереженнях називається гомоскедастичністю.

Якщо  дисперсія  залишків  змінюється  для кожного

спостереження або групи спостережень, тобто М(ии') Фои8, то це явище називається гетероскедастичність. Тут позначено: С7І2 дисперсія залишків, яка виступає невідомим параметром; Б

відома симетрична додатно визначена матриця. Зауважим, що обидва        терміни   гомоскедастичність та гетероскедастичність запропоновані відомим російським вченим-статистиком A.A. Чупровим.

При наявності гетероскедастичності залишків и оцінки параметрів моделі 1МНК будуть незміщеними, обґрунтованими, але неефективними. При цьому формулу для обчислення стандартної помилки спостережень застосовувати не можна.

При наявності гетероскедастичності в простій економетричній моделі, тобто Y = a0 + a}X + u, щоб оцінити

параметри 1МНК, достатньо змінити специфікацію моделі. Коли будується модель множинної регресії з багатьма змінними, то таке перетворення значно ускладнюється. Тому спочатку треба одним із методів визначити наявність гетероскедастичності, а потім оцінити параметри моделі із застосуванням спеціального підходу, який буде розглянутий пізніше.

Розглянемо на прикладі, як за рахунок перетворення вхідної інформації та зміни специфікації моделі можна обійти явище гетероскедастичності.

Приклад 7.2 [28]. Необхідно побудувати економетричну модель, що характеризує залежність між заощадженнями та доходами населення, млрд.г.о.:

Таблиця 7.3   

Рік

Заощадження

(у)

Дохід (х)

Рік

Заощадження

(у)

Дохід (х)

1

0,36

8,8

10

0,59

15,5

2

0,20

9,4

11

0,90

16,7

3

0,08

10,0

12

0,95

17,7

4

0,20

10,6

13

0,82

18,6

5

0,10

11,0

14

1,04

19,7

6

0,12

11,9

15

1,53

21,1

7

0,41

12,7

16

1,94

22,8

8

0,50

13,5

17

1,75

23,9

9

0,43

14,3

18

1,99

25,2

 

Скориставшись оператором оцінювання 1МНК

А = (X Х)~'Х Y, знаходимо параметри моделі: а0 =-1,081; =0,1178. Тоді економетрична модель має вигляд рівняння парної регресії: 6 = -1,081+0,1178х.

Можна висунути гіпотезу, що відхилення заощаджень від норми можуть бути пропорціональними до доходу, тобто до цієї моделі ймовірне існування гетероскедастичності залишків.

Для того, щоб обійти явище гетероскедастичності можна, як варіант, перетворити вхідну інформацію, розглянувши такі нові змінні (таблиця 7.4.):

у* = —;   х* = — . х х

Таблиця 7.4   

Рік

у*

X*

Рік

у*

X*

1

0,041

0,114

10

0,038

0,065

2

0,022

0,106

11

0,054

0,060

3

0,008

0,100

12

0,054

0,056

4

0,019

0,094

13

0,044

0,054

5

0,009

0,091

14

0,053

0,051

6

0,010

0,084

15

0,073

0,047

7

0,032

0,079

16

0,085

0,044

8

0,0037

0,074

17

0,073

0,042

9

0,0030

0,070

18

0,079

0,040

Нове рівняння регресії за даними таблиці має вигляд: у* = -0,854 + 0,1026х*.

В результаті перетворення вхідних даних повністю змінилась специфікація моделі: змінна у * характеризує відносний показник рівня заощаджень на одиницю доходу. При цьому спостереження з меншими значеннями х* мають відносно більшу питому вагу при оцінюванні параметрів моделі, ніж у першому варіанті, а це означатиме, що явище гетероскедастичності не впливає на оцінки параметрів 1МНК.

7.4. Методи визначення гетероскедастичності

 

Використання того чи іншого методу перевірки економетричної моделі на наявність гетероскедастичності залежить від вхідних даних. Можуть бути запропоновані чотири таких методи: критерій /і; параметричний тест Гольдфельда-Квандта; непараметричний тест Гольдфельда-Квандта; тест Глейсера. Розглянемо послідовність тестування наявності гетероскедастичності.

Критерій /і. Цей метод використовується при великої кількості сукупності спостережень п, яких може бути удвічі більше, ніж оцінюваних параметрів. Вхідні дані залежної змінної У розбиваються на к груп з номерами г=1...к. За кожною групою спостережень розраховується сума квадратів відхилень:

 

5.

ХІУіг Уг У­

(7.4)

 

і=1

Обчислюється сума квадратів відхилень у цілому для сукупності спостережень:

І>г = І І (У. Уг У, (7.5)

г=1      і=1 і=1

де пг кількість спостережень у кожній групі г. Розраховується параметр А:

п/2

 

к ґ 5 пгІ2

І 5г

г=1

 

(7.6)

 

і=1

п

 

 

де П   прибуток к виразів за цією позначкою.

Обчислюється критерій

ц = -21пА, (7.7)

який наближено відповідає розподілу X при ступені вільності (к-1) та рівні довіри (1-а). Якщо /і>ХІшвл , то у розглядаємій множині спостережень має місце гетероскедастичність.

Приклад  7.3.  Перевірка  гетероскедастичності на основі критерію /л [28].

Для даних, які наведені в прикладі 7.2, перевірити наявність гетероскедастичності за критерієм / . Розв'язання

Крок 1. Дані таблиці 7.3 розбиваються на три групи по шість спостережень у кожній:

 

Група 1

Група 2

Група 3

0,36

0,41

0,82

0,20

0,50

1,04

0,08

0,43

1,53

0,20

0,59

1,94

0,10

0,90

1,75

0,12

0,95

1,99

Крок 2. Розраховуються середні значення змінних у кожній групі та суми квадратів відхилень індивідуальних значень кожної групи від середнього значення:

У = 0,1767;   У2 = 0,6300;   У3 = 1,5117;

51 = І(Уи У1)2 = 0,05313; 82 = І(Уі2 У2)2 = 0,2822;

=1

=1

Яз =І (Уз Уз)2 = 1,1703.

=1

Крок 3. Обчислюється сума квадратів відхилень за

трьома групами:

І Бг = Б, + Б2 + Я3 = 0,05313 + 0,2822 +1,1703 = 1,5056..

г=1

Крок 4. Розраховується параметр А:

ґ к     Л пІ2

І 5

к   ґ ?   у-"-    /   і ^ '

 

г=1

0,00265.

 

Подпись: п
V )
і=1 V пг )

 

Крок 5. Знаходиться критерій /:

 

/ = -21пА = 11,85.

За статистичними таблицями розподілу X вибирається Хтабл. з ступенями вільності (к-1)=2 та рівні довіри (1-а)=0,99: Х2шабл=9,21 (див. додаток В). Оскільки /і>£табл, то спостерігається гетероскедастичність.

Параметричний тест Гольдфельда-Квандта. Метод застосовується при досить великої кількості спостережень п, коли дисперсія залишків зростає пропорційно квадрату однієї з незалежних змінних моделі. Тест починається з упорядкування за зменшенням незалежних змінних Х](]=1...т) відносно тієї змінної, яка підозрюється на гетероскедастичність. Виключають с середніх (у цьому упорядкуванні) спостережень. Оптимальне значення с за дослідженням авторів тесту

4

с = — п. (7.8) 15

Будуються дві економетричні моделі на основі 1МНК з розміром спостережень (п с )/2 для першої моделі і таким же розміром для другої. Обчислюється сума квадратів залишків за першою Я1 та другою Б2 моделями:

81 =' п'1п1; Б2 = и'2п2, (7.9) де и1 та и2 залишки моделями (1) та (2). Обчислються критерій

Я* = (7.10)

який наближено відповідає Е-критерію Фішера. За статистичними таблицями знаходиться значення Ртабл, для ступенів вільності (п - с 2т1)2, (п с 2т1)2 і вибраного рівня довіри, де т1 загальна кількість оцінюваних параметрів у моделі. Якщо Я* > Ртабл , то це свідчить про

наявність гетероскедастичності.

Непараметричний      тест Гольдфельда-Квандта

базується на розгляді графічно зображеної залежності залишків иі від упорядкованих спостережень за значеннями Х](]=1...т). Якщо для всіх значень змінної Ху залишки розподіляються нерівномірно і без певної закономірності, то дисперсія залишків є змінною величиною і спостерігається явище гетероскедастичності.

Тест Глейсера відповідає знаходженню параметрів регресійної моделі за допомогою 1МНК при використанні абсолютних значень залишків в функції від незалежної змінної

Х/,  яка  може  викликати  зміну дисперсії   (Т2.  Для цього

використовується одна з таких видів функцій:

1

и = а0 + а1х]; |и| = а0 + а1х-1; |и| = а0 + а1х2. (7.11)

Рішення про гетероскедастичність на підставі значень параметрів а0 і а1 таке: чистій гетероскедастичності відповідає значення         параметрів     а0 = 0, а1 Ф 0; змішаній

гетероскедастичності а0 = 0, а1 Ф 0 .

Крім    розглянутих   методів визначення

гетероскедастичності існують інші, з якими можна познайомитись у зазначеній літературі: графічний аналіз і тест рангової кореляції Спірмена [24]; тест Бреуша-Пагана [26].

 

7.5. Узагальнений метод найменших квадратів (метод Ейткена). Прогноз за моделлю

 

Економетрична модель, в якої спостерігається явище гетероскедастичності, є узагальненою моделлю і для оцінювання її параметрів слід використовувати не метод найменших квадратів (1МНК), а узагальнений метод найменших квадратів (метод Ейткена, або скорочено УМНК).

Ідея УМНК полягає у знаходженні оцінок матриці параметрів А моделі з використанням додатково визначеної діагональної матриці 5, за допомогою якої коригується вхідна інформація.

Матриця 5 має вигляд:

 

 

 

 

 

8

' 1 л — 00...0

а

0 — 0...0

А.

 

(7.12)

 

 

1

0 0 0 ...

Ап )

де Аі параметри, які обчислюються з використанням гіпотез:

а)         дисперсія    залишків    пропорційна    до змін

пояснювальної змінної х,-, тоді Аі = — (( = 1...п, у = 1...т);

5

б)         дисперсія залишків пропорційна до зміни квадрату

2          ■   , 1

пояснювальної змінної х2, тоді Аі

х2

в) дисперсія залишків пропорційна до зміни квадрату залишків за модулем |и,|2 , тоді Аі = иі|}2 .

Оскільки матриця 5 = Р Р, то матриця Р має вигляд:

 

1

0    0 ... 0

 

 

 

Р

 

0

 

1

 

0 ... 0

 

 

Р-1 =

Гу[А~1 0   0 ... 0 Л 0 у[АА 0 ... 0

 

 

 

 

0   0   0 ...

1

УІАп

0   0  0 ...рАп

 

За наявністю гетероскедастичності узагальнена модель має вигляд

 

У* = АХ* +и*, де У* = Р~1У; X* = Р~1Х; и* = Р_1и.

(7.13)

 

 

Використання для узагальненої моделі (7.13) 1МНК приводить до такого оператора оцінювання параметрів УМНК:

А = [х'Б _1 X )_1 X Б _1У. (7.14) Найкращий лінійний незміщений прогноз за моделлю УМНК визначається за співвідношенням

р = Х0 А + \¥'У _1и, (7.15) де V = (72иБ відома симетрична додатково визначена матриця;

V матриця поточних і прогнозних значень залишків; Х0 -заданий вектор точкового періоду.

Величина V 'V ~'и визначає залишки прогнозного періоду і може розглядатися як помилка прогнозу на підставі моделі У = АХ0.

Приклад 7.4 [28]. Використовуючи дані таблиці 7.5, де спостерігається гетероскедастичність, дати оцінки параметрів моделі згідно з методом Ейткена.

Розв'язання

1.         Ідентифікація змінних:

У витрати на харчування, залежна змінна; X загальні витрати, незалежна змінна. Тоді загальний вигляд економетричної моделі такий: У = а0 + а1 X + и;

У = а1 + а1 X; и = У У.

2.         Згідно з першою гіпотезою припустимо, що в діагональній матриці Б елементи Л пропорційні до зміни

пояснювальної змінної хі, тобто Лі = — (хі загальні витрати за

і-м спостереженням). Тоді обернена матриця до Б записується у вигляді (вище та нижче головної діагоналі нулі):

ґ0,0667 0 > 0 0,0667 0 0 0,0625 0 0 0,0588 0 0 0,0588 0

Б -1

0 0 0556 0 0 0 0526 0 0 0 05 0 0 0 05 0

0 0,0454 0 0 0,01562 0 0 0001471 0 0 0 ,01389 0 0 0,0125 0 0 0,0118 0 0 0,0111 0 0 0,0105 0 0 0,01

3.       Знайдемо матрицю, транспоновану до матриці пояснювальної змінної:

 

 

X '_

(111111111111111111 ^ 15 15 16 1 7 1 7 18 19 20 20 22 64 68 72 80 85 90 95100

 

 

 

4.

 

5.

Добуток матриць:

7

,  ,     ( 0,667 18^ {18 833 Розрахунок оберненої матриці:

 

(X 'Б ~1Х)-1

(  3,5934   0,0776Л - 0,0776      0,00297

 

6.

X 'Б ~1У

Розрахунок матриці (X 'Б 1У): ( 1,5998л к48,04 '

А _ (X Б _1 X )-1 X Б "У

7.         Оцінка параметрів моделі за методом Ейткена: ( 3,5934   0,0776^ ( 1,5998^

■0,0776     0,00297 {48,04 ~ _ ґ2,0187Л ~ ч0,0141 '

Економетрична модель витрат на харчування для теоретичних даних запишеться у вигляді:

У _ 2,0187 + 0,01410.

Економічний    аналіз    характеристик моделі приводить до такого:

а)         коефіцієнт детермінації Я2=0,722, а це означає, що 72,2\% витрат на харчування залежить від загальних витрат;

б)         коефіцієнт кореляції Я _ VЯ2 _ 0,850, що свідчить про досить тісний зв'язок між витратами на харчування та загальними витратами;

в)         залишкова дисперсія с?2 _ 0,083 показує, що розрахункові значення витрат на харчування дуже близькі до фактичних;

г)         параметр моделі а1 _ 0,0141 свідчить про те, що збільшення загальних витрат на одиницю сприятиме зростанню витрат на харчування на 0,0141 одиниць.

 

7.6. Природа і наслідки автокореляції

 

При побудові економетричних моделей з використанням динамічних (часових) рядів доводиться враховувати взаємозв'язок між собою випадкових величин у різні моменти часу. Такими випадковими величинами в моделях часто виступають залишки. Кореляційна залежність між послідовними значеннями залишків однієї вибірки множини спостережень через деякий період часу (запізнення, або лаг) називають автокореляцією. Наприклад, якщо між значеннями однієї вибірки и1, и2, ир та и2, и3, ир+1 є залежність, то маємо справу з автокореляцією; залежність між значеннями двох різних вибірок и1, и2, ир та у^2, уу3, уур+1 називається серійною вибіркою і до розглядаємої теми відношення не має.

При автокореляції математичне сподівання М(піп]) Ф 0 для і Ф і, що свідчить про порушення другої

умови використання 1МНК (див. п. 6.2), коли дисперсія залишків постійна, але спостерігається їх коваріація, тобто взаємозв'язок кожного наступного значення залишків з попереднім.

Виникнення автокореляції залишків може бути зв'язана з такими причинами:

автокореляцією послідовних елементів матриць залежної та незалежних змінних;

автокореляцію послідовних значень змінних, які не ввійшли до економетричної моделі;

•           помилкою спеціфікації економетричної моделі. Коваріація      залишків      у      загальному вигляді

економетричної моделі запишеться у вигляді

М(и,и,_8) _рБаІ, (7.16)

де t,s моменти часу; ркоефіцієнт автокореляції, який характеризує рівень взаємозв'язку кожного наступного значення залишків ut-S з попереднім ut.

Вираз (7.16) означає, що за наявністю автокореляції залишків форма порушення другої необхідної умови для застосування 1МНК має вигляд:

M(uu') = (J2US, (7.17)

де S матриця коефіцієнтів автокореляції s-го порядку для динамічного ряду залишків Ut

 

 

 

S

1 р

р2

р 1

р

р2р3 р р2 1 р п-1~

рп-2 рп-3 (7.18)

 

 

 

рп-1 рп-2 рп-3 рп-4

1

 

Якщо  нехтувати  наявністю   автокореляції залишків, використання 1МНК може привести до таких наслідків:

оцінки параметрів моделі будуть зміщеними;

статистичні критерії Ст'юдента (t-критерій) і Фішера (F-критерій) не можуть бути використані для аналізу моделі;

прогноз економетричної моделі буде неефективним.

 

7.7. Методи визначення автокореляції

 

Наявність автокореляції перевіряється за такими критеріями: Дарбіна-Уотсона; фон Неймана; нециклічного коефіцієнта автокореляції; циклічного коефіцієнта автокореляції.

Критерій Дарбіна-Уотсона. Цей критерій є найбільш відомим і поширеним для перевірки наявності автокореляції залишків:

 

= 1=2   . (7.19)

 

X

и2

 

І=1

Він може приймати значення в діапазоні від 0 до 4. Фактичні значення критерію за формулою (7.19) порівнюються з табличними, які вибираються в залежності від числа спостережень п та числа незалежних (пояснювальних) змінних т. Табличні значення мають нижню межу ВШ1 і верхню ВШ2.

Якщо Ві¥<Ві¥1, то залишки мають автокореляцію. При Ві¥<Ві¥2 автокореляція відсутня. Коли Ві¥1<Ві¥<В}¥2, то для конкретних висновків треба далі проводити дослідження, збільшивши сукупність спостережень.

Критерій фон Неймана використовується у вигляді:

£) = ВЖ-?—. (7.20) п -1

Фактичне значення критерія фон Неймана за формулою (7.20) порівнюється з табличними. Якщо ()<()табл, то існує додатна автокореляція.

На практиці часто замість нециклічного коефіцієнта автокореляції обчислюють циклічний коефіцієнт автокореляції, який має вигляд:

 

г ~ р =

(    1       п

—1X и<иі-1

П     1 І=2 )

1

2

І

і=1 )

+ ^ .(7.21)

п

 

Коефіцієнт г може набувати значень від -1 до +1. Від'ємні його значення свідчать про від'ємну автокореляцію, додатні про додатну. Значення г близько нуля свідчать про відсутність автокореляції залишків.

Фактично обчислене значення г порівнюють з табличним (критичним) гтабл для вибраного з статистичних таблиць (додаток К) рівня значимості а і довжини динамічного ряду п. Якщо г > гтабл^, то існує автокореляція.

 

7.8. Методи оцінки параметрів моделі з автокореляцією. Прогноз за моделлю

 

 

Для оцінювання параметрів моделі з автокорельованими залишками можна застосувати такі методи: Ейткена; перетворення вхідної інформації; Кочрена-Оркатта; Дарбіна.

Метод Ейткена використовується тоді, коли залишки задовільнюють авторегресійну модель першого порядку. Він базується на скоригованій вхідній інформації з урахуванням коваріації залишків. Система рівнянь для оцінки параметрів моделі даного методу, який був розглянутий раніше, має вигляд:

(X 5 X )і = X Б ~1У, (14.7)

де А матриця (вектор) оцінок параметрів моделі; X, X' -висхідна та транспонована до неї матриця незалежних змінних; У матриця залежних змінних; Б-1 матриця, обернена до матриці коваріації залишків.

Звідси оператор оцінювання за методом Ейткена має

вигляд:

А = (х 'Б-1X )-1 ҐБ    . (7.23)

Оскільки коваріація залишків р при Б>2 часто наближається до нуля, то обернену матрицю коваріації залишків доцільно використовувати у вигляді:

г 1   -р    0     0   0 ... 0 >

0   0 ... 0

-Р р 1 + р2-р

 

5-1 =

1

1 -Р2

0  -р   1 + р2-р 0 ... 0

.(7.24)

 

 

 

00

0    0    0 0 1

 

Метод       перетворення       вхідної інформації

використовується при авторегресійній моделі першого порядку. Він дає оцінку параметрів моделі за допомогою двокрокової процедури:

1)       перетворення вхідної інформації за допомогою матриці перетворення Т;

2)       застосування 1МНК для оцінки перетворених даних.

Економетрична модель представляється у вигляді TY = TAX + Tu , (7.25) щоб матриця перетворення Т відповідала умові

M(Tuu T') = a2uE. (7.26)

за

Тому   перетворення   вхідної   інформації виконується допомогою такої матриці розміром n * n:

ф -р2   0  0  0 ... 0

 

 

1

0

0

... 0

т =

0

1

0