Për vlerësim përdoren kriteret e Pearson. Testimi i hipotezës për shpërndarjen normale të popullsisë duke përdorur kriterin Pearson

Në disa raste, studiuesi nuk e di paraprakisht saktësisht sipas cilit ligj shpërndahen vlerat e vëzhguara të karakteristikës që studiohet. Por ai mund të ketë arsye mjaft të mira për të supozuar se shpërndarja i nënshtrohet një ose një ligji tjetër, për shembull, normal ose uniform. Në këtë rast, parashtrohen hipotezat statistikore kryesore dhe alternative të llojit të mëposhtëm:

    H 0: shpërndarja e karakteristikës së vëzhguar i nënshtrohet ligjit të shpërndarjes A,

    H 1: shpërndarja e karakteristikës së vëzhguar ndryshon nga A;

ku si A mund të shfaqet një ose një ligj tjetër i shpërndarjes: normal, uniform, eksponencial, etj.

Testimi i hipotezës për ligjin e pritshëm të shpërndarjes kryhet duke përdorur të ashtuquajturat kritere të përshtatshmërisë. Ka disa kritere për marrëveshje. Më universali prej tyre është kriteri Pearson, pasi është i zbatueshëm për çdo lloj shpërndarjeje.

-Kriteri Pearson

Në mënyrë tipike, frekuencat empirike dhe teorike ndryshojnë. A është e rastësishme mospërputhja e frekuencës? Kriteri Pearson jep një përgjigje për këtë pyetje, megjithatë, si çdo kriter statistikor, ai nuk dëshmon vlefshmërinë e hipotezës në një kuptim rreptësisht matematikor, por vetëm vendos pajtimin ose mospajtimin e tij me të dhënat vëzhguese në një nivel të caktuar rëndësie.

Pra, le të merret një shpërndarje statistikore e vlerave të atributeve nga një mostër vëllimi, ku janë vlerat e atributeve të vëzhguara dhe janë frekuencat përkatëse:

Thelbi i kriterit Pearson është llogaritja e kriterit duke përdorur formulën e mëposhtme:

ku është numri i shifrave të vlerave të vëzhguara dhe është frekuenca teorike e vlerave përkatëse.

Është e qartë se sa më të vogla të jenë dallimet, aq më afër shpërndarja empirike është me atë empirike, prandaj, sa më e ulët të jetë vlera e kriterit, aq më e sigurt mund të thuhet se shpërndarjet empirike dhe teorike i nënshtrohen të njëjtit ligj.

Algoritmi i kriterit Pearson

Algoritmi i kriterit Pearson është i thjeshtë dhe konsiston në kryerjen e hapave të mëposhtëm:

Pra, i vetmi veprim jo i parëndësishëm në këtë algoritëm është përcaktimi i frekuencave teorike. Ato, natyrisht, varen nga ligji i shpërndarjes, dhe për këtë arsye përcaktohen ndryshe për ligje të ndryshme.

Test statistikor

Rregulli me të cilin hidhet poshtë ose pranohet hipoteza I 0 quhet kriter statistikor. Emri i kriterit, si rregull, përmban një shkronjë që tregon një karakteristikë të përpiluar posaçërisht nga pika 2 e algoritmit të testimit të hipotezave statistikore (shih pikën 4.1), të llogaritur në kriter. Në kushtet e këtij algoritmi, kriteri do të quhej "V-kriteri".

Gjatë testimit të hipotezave statistikore, dy lloje gabimesh janë të mundshme:

  • - Gabim i llojit I(ju mund ta refuzoni hipotezën I 0 kur ajo është në të vërtetë e vërtetë);
  • - Gabim i tipit II(mund ta pranoni hipotezën I 0 kur në fakt nuk është e vërtetë).

Probabiliteti A Bërja e një gabimi të tipit I quhet niveli i rëndësisë së kriterit.

Nëse për R tregoni probabilitetin për të bërë një gabim të llojit të dytë, atëherë (l - R) - probabiliteti për të mos bërë një gabim të tipit II, i cili quhet fuqia e kriterit.

Testi i përshtatshmërisë së Pearson x 2

Ekzistojnë disa lloje të hipotezave statistikore:

  • - për ligjin e shpërndarjes;
  • - homogjeniteti i mostrave;
  • - vlerat numerike të parametrave të shpërndarjes, etj.

Ne do të shqyrtojmë hipotezën në lidhje me ligjin e shpërndarjes duke përdorur shembullin e testit të mirësisë së përshtatjes së Pearson x 2.

Kriteri i marrëveshjes quhet kriter statistikor për testimin e hipotezës zero për ligjin e supozuar të një shpërndarjeje të panjohur.

Testi i përshtatshmërisë së Pearson-it bazohet në një krahasim të frekuencave empirike (të vëzhguara) dhe teorike të vëzhgimeve të llogaritura nën supozimin e një ligji të caktuar të shpërndarjes. Hipoteza #0 këtu formulohet si më poshtë: sipas karakteristikës që studiohet, popullsia është e shpërndarë normalisht.

Algoritmi i testimit të hipotezave statistikore #0 për kriterin x 1 Pearson:

  • 1) ne parashtrojmë hipotezën I 0 - sipas karakteristikës që studiohet, popullsia e përgjithshme shpërndahet normalisht;
  • 2) llogaritni mesataren e mostrës dhe mesataren e mostrës devijimi standard O V;

3) sipas madhësisë së mostrës në dispozicion P ne llogarisim një karakteristikë të përpiluar posaçërisht,

ku: i, janë frekuenca empirike, - frekuencat teorike,

P - Madhësia e mostrës,

h- madhësia e intervalit (ndryshimi midis dy opsioneve ngjitur),

Vlerat e normalizuara të karakteristikës së vëzhguar,

- funksioni i tabelës. Gjithashtu frekuencat teorike

mund të llogaritet duke përdorur funksionin standard MS Excel NORMIDIST duke përdorur formulën;

4) duke përdorur shpërndarjen e mostrës, ne përcaktojmë vlerën kritike të një karakteristike të përpiluar posaçërisht xl P

5) kur hipoteza # 0 refuzohet, kur hipoteza # 0 pranohet.

Shembull. Le të shqyrtojmë shenjën X- vlera e treguesve të testimit për të dënuarit në një nga kolonitë korrektuese për disa karakteristikat psikologjike, i paraqitur në formën e një serie variacionesh:

Në një nivel rëndësie prej 0.05, provoni hipotezën e shpërndarjes normale popullatë.

1. Bazuar në shpërndarjen empirike, mund të parashtrohet një hipotezë H 0: sipas kriterit të studiuar “vlera e treguesit të testimit për një karakteristikë të caktuar psikologjike”, popullata e përgjithshme

pritet shpërndahet normalisht. Hipoteza alternative 1: sipas kriterit të studiuar “vlera e treguesit të testit për një karakteristikë të caktuar psikologjike”, popullata e përgjithshme e të dënuarve nuk shpërndahet normalisht.

2. Le të llogarisim karakteristikat numerike të mostrës:

Intervalet

x g y

X) sch

3. Le të llogarisim karakteristikën e përpiluar posaçërisht j 2 . Për ta bërë këtë, në kolonën e parafundit të tabelës së mëparshme gjejmë frekuencat teorike duke përdorur formulën, dhe në kolonën e fundit

Le të llogarisim karakteristikat % 2. marrim x 2 = 0,185.

Për qartësi, ne do të ndërtojmë një poligon të shpërndarjes empirike dhe një kurbë normale bazuar në frekuencat teorike (Fig. 6).

Oriz. 6.

4. Përcaktoni numrin e shkallëve të lirisë s: k = 5, t = 2, s = 5-2-1 = 2.

Sipas tabelës ose duke përdorur funksionin standard MS Excel "HI20BR" për numrin e shkallëve të lirisë 5 = 2 dhe nivelin e rëndësisë a = 0,05 le të gjejmë kritiken vlera e kriterit xl P.=5,99. Për nivelin e rëndësisë A= 0,01 vlera e kriterit kritik X%. = 9,2.

5. Vlera e kriterit të vëzhguar X=0,185 më pak se të gjitha vlerat e gjetura Hk R.-> prandaj hipoteza I 0 pranohet në të dy nivelet e rëndësisë. Mospërputhja midis frekuencave empirike dhe teorike është e parëndësishme. Prandaj, të dhënat e vëzhgimit janë në përputhje me hipotezën e një shpërndarjeje normale të popullsisë. Kështu, sipas kriterit të studiuar “vlera e treguesit të testimit për një karakteristikë të caktuar psikologjike”, popullsia e përgjithshme e të dënuarve shpërndahet normalisht.

  • 1. Koryachko A.V., Kulichenko A.G. Matematikë e lartë dhe metodat matematikore në psikologji: një udhëzues për klasa praktike për studentët e Fakultetit të Psikologjisë. Ryazan, 1994.
  • 2. Nasledov A.D. Metodat matematikore kërkime psikologjike. Analiza dhe interpretimi i të dhënave: Teksti mësimor, manual. Shën Petersburg, 2008.
  • 3. Sidorenko E.V. Metodat e përpunimit matematikor në psikologji. Shën Petersburg, 2010.
  • 4. Soshnikova L.A. dhe të tjera Analiza statistikore me shumë variacione në ekonomi: Libër mësuesi, manual për universitetet. M., 1999.
  • 5. Sukhodolsky E.V. Metodat matematikore në psikologji. Kharkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Workshop mbi teorinë e statistikës: Libër mësuesi, manual. M., 2009.
  • Gmurman V.E. Teoria e Probabilitetit dhe Statistikat Matematikore. F. 465.

Gjerësia e intervalit do të jetë:

Xmax është vlera maksimale e karakteristikës së grupimit në agregat.
Xmin është vlera minimale e karakteristikës së grupimit.
Le të përcaktojmë kufijtë e grupit.

Numri i grupitFundiKufiri i sipërm
1 43 45.83
2 45.83 48.66
3 48.66 51.49
4 51.49 54.32
5 54.32 57.15
6 57.15 60

E njëjta vlerë e atributit shërben si kufijtë e sipërm dhe të poshtëm të dy grupeve ngjitur (të mëparshëm dhe të mëvonshëm).
Për secilën vlerë të serisë, ne numërojmë sa herë ajo bie në një interval të caktuar. Për ta bërë këtë, ne rendisim seritë në rend rritës.
43 43 - 45.83 1
48.5 45.83 - 48.66 1
49 48.66 - 51.49 1
49 48.66 - 51.49 2
49.5 48.66 - 51.49 3
50 48.66 - 51.49 4
50 48.66 - 51.49 5
50.5 48.66 - 51.49 6
51.5 51.49 - 54.32 1
51.5 51.49 - 54.32 2
52 51.49 - 54.32 3
52 51.49 - 54.32 4
52 51.49 - 54.32 5
52 51.49 - 54.32 6
52 51.49 - 54.32 7
52 51.49 - 54.32 8
52 51.49 - 54.32 9
52.5 51.49 - 54.32 10
52.5 51.49 - 54.32 11
53 51.49 - 54.32 12
53 51.49 - 54.32 13
53 51.49 - 54.32 14
53.5 51.49 - 54.32 15
54 51.49 - 54.32 16
54 51.49 - 54.32 17
54 51.49 - 54.32 18
54.5 54.32 - 57.15 1
54.5 54.32 - 57.15 2
55.5 54.32 - 57.15 3
57 54.32 - 57.15 4
57.5 57.15 - 59.98 1
57.5 57.15 - 59.98 2
58 57.15 - 59.98 3
58 57.15 - 59.98 4
58.5 57.15 - 59.98 5
60 57.15 - 59.98 6

Rezultatet e grupimit do t'i paraqesim në formën e një tabele:
GrupetKoleksioni nr.Frekuenca f i
43 - 45.83 1 1
45.83 - 48.66 2 1
48.66 - 51.49 3,4,5,6,7,8 6
51.49 - 54.32 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26 18
54.32 - 57.15 27,28,29,30 4
57.15 - 59.98 31,32,33,34,35,36 6

Tabela për llogaritjen e treguesve.
Grupetx iSasia, f ix i * f iFrekuenca e akumuluar, S|x - x mesatar |*f(x - x mesatar) 2 *fFrekuenca, f i /n
43 - 45.83 44.42 1 44.42 1 8.88 78.91 0.0278
45.83 - 48.66 47.25 1 47.25 2 6.05 36.64 0.0278
48.66 - 51.49 50.08 6 300.45 8 19.34 62.33 0.17
51.49 - 54.32 52.91 18 952.29 26 7.07 2.78 0.5
54.32 - 57.15 55.74 4 222.94 30 9.75 23.75 0.11
57.15 - 59.98 58.57 6 351.39 36 31.6 166.44 0.17
36 1918.73 82.7 370.86 1

Për të vlerësuar serinë e shpërndarjes, gjejmë treguesit e mëposhtëm:
Treguesit e qendrës së shpërndarjes.
Mesatarja e ponderuar


Moda
Modaliteti është vlera më e zakonshme e një karakteristike midis njësive të një popullsie të caktuar.

ku x 0 është fillimi i intervalit modal; h – vlera e intervalit; f 2 – frekuenca që korrespondon me intervalin modal; f 1 – frekuenca premodale; f 3 – frekuenca postmodale.
Ne zgjedhim 51.49 si fillim të intervalit, pasi ky interval përbën numrin më të madh.

Vlera më e zakonshme e serisë është 52.8
mesatare
Mediana e ndan kampionin në dy pjesë: gjysma është më e vogël se mesatarja, gjysma është më shumë.
seri intervali shpërndarja, menjëherë mund të specifikoni vetëm intervalin në të cilin do të vendoset modaliteti ose mesatarja. Mesatarja korrespondon me opsionin në mes të serisë së renditur. Mesatarja është intervali 51.49 - 54.32, sepse në këtë interval, frekuenca e akumuluar S është më e madhe se numri mesatar (mediana është intervali i parë, frekuenca e grumbulluar S e të cilit tejkalon gjysmën e shumës totale të frekuencave).


Kështu, 50% e njësive në popullsi do të jenë më pak në magnitudë se 53.06
Treguesit e variacionit.
Variacione absolute.
Gama e variacionit është diferenca midis vlerave maksimale dhe minimale të karakteristikës së serisë primare.
R = X max - X min
R = 60 - 43 = 17
Devijimi mesatar linear- llogaritur për të marrë parasysh diferencat e të gjitha njësive të popullsisë në studim.


Çdo vlerë e serisë ndryshon nga tjetra jo më shumë se 2.3
Dispersion- karakterizon masën e shpërndarjes rreth vlerës mesatare të saj (një masë e shpërndarjes, d.m.th. devijimi nga mesatarja).


Vlerësues i paanshëm i variancës- vlerësim konsistent i variancës.


Devijimi standard.

Çdo vlerë e serisë ndryshon nga vlera mesatare prej 53.3 me jo më shumë se 3.21
Vlerësimi i devijimit standard.

Masat e variacionit relativ.
Treguesit relativë të variacionit përfshijnë: koeficientin e lëkundjes, koeficienti linear variacionet, devijimi linear relativ.
Koeficienti i variacionit- një masë e shpërndarjes relative të vlerave të popullsisë: tregon se sa përqindje e vlerës mesatare të kësaj vlere është shpërndarja mesatare e saj.

Meqenëse v ≤ 30%, popullsia është homogjene dhe variacioni është i dobët. Rezultatet e marra mund të besohen.
Koeficienti linear i variacionit ose Devijimi linear relativ- karakterizon proporcionin e vlerës mesatare të shenjës së devijimeve absolute nga vlera mesatare.

Testimi i hipotezave për llojin e shpërndarjes.
1. Le të kontrollojmë hipotezën se X është shpërndarë ligj normal duke përdorur testin e mirësisë së Pearson-it.

ku p i është probabiliteti i goditjes intervali i i-të ndryshore e rastësishme, të shpërndara sipas ligjit hipotetik
Për të llogaritur probabilitetet p i, zbatojmë formulën dhe tabelën e funksionit Laplace

Ku
s = 3,21, xav = 53,3
Frekuenca teorike (e pritshme) është n i = np i , ku n = 36
Intervalet e grupimitFrekuenca e vëzhguar n ix 1 = (x i - x mesatar)/sx 2 = (x i+1 - x av)/sF(x 1)F(x 2)Probabiliteti për të hyrë në intervalin i-të, p i = Ф(x 2) - Ф(x 1)Frekuenca e pritur, 36p iTermat e statistikave të Pearson, K i
43 - 45.83 1 -3.16 -2.29 -0.5 -0.49 0.01 0.36 1.14
45.83 - 48.66 1 -2.29 -1.42 -0.49 -0.42 0.0657 2.37 0.79
48.66 - 51.49 6 -1.42 -0.56 -0.42 -0.21 0.21 7.61 0.34
51.49 - 54.32 18 -0.56 0.31 -0.21 0.13 0.34 12.16 2.8
54.32 - 57.15 4 0.31 1.18 0.13 0.38 0.26 9.27 3
57.15 - 59.98 6 1.18 2.06 0.38 0.48 0.0973 3.5 1.78
36 9.84

Le të përcaktojmë kufirin e rajonit kritik. Meqenëse statistika e Pearson mat ndryshimin midis shpërndarjeve empirike dhe teorike, sa më e madhe të jetë vlera e saj e vëzhguar K obs, aq më i fortë është argumenti kundër hipotezës kryesore.
Prandaj, rajoni kritik për këto statistika është gjithmonë krahu i djathtë :)

Publikime mbi temën