Материал: Статистика - Навчальний посібник (Кушнір Н.Б.)


9.3. поняття про помилки вибірки

 

При визначенні помилки вибірки мова йде про те, щоб максимально наблизити показники вибіркової сукупності до показників генеральної сукупності і виявити допустимі граничні відхилення цих показників.

Помилка репрезентативності, або різниця між вибірковою і генеральною характеристикою (часткою та середньою), яка виникає внаслідок несуцільного спостереження, в основі якого лежить випадковий відбір, розраховується як границя ймовірної помилки. В якості рівня гарантованої ймовірності приймається 0,954 або 0,997. Тоді границя помилки визначається величиною, що подвоєна або потроєна до середньої помилки вибірки.

В загальному виразі границя помилки

 

А = 1

(9.1)

 

 

де А гранична помилка; X коефіцієнт, який пов'язаний з ймовірністю, що гарантує результат (значення X при заданій ймовірності   р   визначається   за  таблицею   значень   (р(), яка

розраховується як похідна за формулою Лапласа); // - помилка; Наприклад,

р = 0,954 А = 2/ р = 0,997        А = 3/

 

Величина середньої помилки вибірки Ц    різна для окремих

видів випадкового відбору. При найбільш простій системі -випадковому повторному відборі, середня помилка визначається за такими формулами:

а) індивідуальний відбір

 

Подпись:  (9.2)

де загальна дисперсія ознаки, п кількість відібраних одиниць спостереження.

б) груповий (гніздовий, серійний) відбір:

 

8

2

 

(9.3)

 

 

 

 

К для індивідуального відбору: К

і п

1          < 1

N

 

К для серійного відбору

К

1 ­

г Я

< 1

 

Звісно, що користуватись цією поправкою доцільно лише тоді, коли відносний обсяг вибірки складає помітну частину генеральної сукупності ( не менше як 10\% , тоді К < 0,95).

3. При районованому механічному відборі з типових груп одиниць генеральної сукупності використовується середня з групових дисперсій. Так, при індивідуальному відборі, який пропорційний числу відібраних типових груп маємо середню помилку вибірки:

 

 

 

Подпись: 2 Щ

А = 2/ = 2

2

п

при Р = 0,954,

(9.4)

В цій формулі (У групова дисперсія  і ї групи; п, обсяг

вибірки і ї групи.

Визначення помилок вибіркових характеристик дозволяє встановити ймовірні границі знаходження відповідних генеральних показників

а) для середньої:

 

XX

де

(9.5)

вибіркова середня;  А~

генеральна середня;

помилка вибіркової середньої. б) для частки (долі):

Р = а±Аа, (9.6)

де   р генеральна частка; (вибіркова частка; А(помилка

вибіркової частки.

Приклад . З ймовірністю 0,954 визначити границі середньої ваги пачки чаю, яка надходить в торгову мережу, якщо контрольна вибіркова перевірка дала результати:

Таблиця 9.1.

 

х

Е хУ 2

Е у

^     К + х0 = — 1 + 49,5 = 49,7 гр. 0 10

 

2. Вибіркова дисперсія пачки чаю дорівнює

 

а2

 

Е У    Е У

8

10

 

110.

2

 

0,76

 

3. Середня помилка вибіркової середньої:

 

°2 = . № = ±0,087

п     1/100        ' грн.

Гранична помилка з ймовірністю 0,954:

А = 2м = 2(±0,087) = ±0,174 грн.

Границя генеральної середньої:

х = ~~ ± А = 49,7 ± 0,174 = 49,7 ± 0,2 грн.

Таким чином, з ймовірністю 0,954 можна стверджувати, що вага пачки чаю в середньому для всієї партії не більше як 49,9 і не менше 49,5.

Приклад. Розв'яжемо попередню задачу, якщо вибірка складає 25\% генеральної сукупності.

К=д/1 0,25 =70775 « 0,87

X = 49,7 ± 0,2 • 0,87

Приклад. З ймовірністю 0,997 визначити помилку частки при 5\% гніздовій вибірці 100 гнізд за таких умов:

загальна дисперсія близька до тах, а емпіричне кореляційне співвідношення дорівнює 0,8.

а2

Знайти частку ().

= 3.

г

[З2

А = 3м = 3

. 100

Необхідну для розрахунку міжгрупову дисперсію (О ) обчислюємо на основі емпіричного кореляційного співвідношення:

?2

РЯ=0,5   П =  — а2 = 0,25   0,8 =. —2

а2 а

З2 = (0,8 • 0,5)2 = 0,16 Аа = 3^/0,16/100 = ±0,12

 

Приклад. Визначити границі генеральної середньої за такими результатами типової вибірки.

о

900

1) Визначення границі середньої з ймовірністю Р = 0,954

 

х = х ± 2//= х ± 2-і

1

 

Розрахувати необхідні характеристики:

:33,3

— 2

о

= Е хі ■ пі = (32 • 600 + 36 • 300) Х =   Е П   ~ 900

Розрахувати середню (внутрішньогрупову) дисперсію:

(400•600+900•300)

:566

Е*2 ■ п Е п

 

V 900

Оо = [560

М = ,І — = V п

: ±0,79

 

Таким чином, з ймовірністю 0,954 можна стверджувати, що генеральна середня лежить в межах: 33,3-1,58 < х < 33,3+1,58 31,72 < х < 34,88

х = 33,3 ± 2 ■ 0,79

 

9.5. Розрахунок необхідної чисельності вибірки

 

Визначення обсягу вибірки при заданій її точності є проблема, що обернена до питання визначення помилки вибірки при даному об'ємі. Формула об'єму вибірки витікає із відповідної формули граничної помилки. Так, для індивідуального безповторного відбору формула необхідної чисельності вибірки має вид:

і2 ■ <?2 ■ N

п = ~2 2          Т , (97)

і2 а2 + N ■А2

де N чисельність генеральної сукупності; О2 загальна дисперсія; і 2(0,954) гранична ймовірність.

Для групового безповторного відбору (серійного або гніздового): Г =    '' 32 ■Я (9.8)

і2 ■З + Я -А2,

З2 міжгрупова дисперсія; R кількість серій.

Приклад. Визначити абсолютний і відносний об'єм індивідуального відбору для обстеження генеральної частки за умови, щоб помилка частки з ймовірністю 0,954 не перевищувала 0,02. Вибірка проводиться з генеральної сукупності об'ємом: а) 1000 од.; б)100000 од. .

Для визначення необхідного обсягу вибірки використовують

ф                     '2 о2N            -           + 2

формулу   п = ,  в  якій  припускаємо,  що  1=2, а

і2 -о + N А2 2

максимальна дисперсія О =0,25; N=1000:

ч          22-0,25 4000   „,„   к пл л0/

а)         п = —2            т = 714 або 71,4\%

22-0,25 +1000 (0,02)2

б)         22 0,25 100000           „„„Л б 2 44\% б)  п = = 2439 або 2,44\%

22 -0,25 +100000 (0,02)2