Hindamisel kasutatakse Pearsoni kriteeriume. Üldpopulatsiooni normaaljaotuse hüpoteesi testimine Pearsoni kriteeriumi järgi

Mõnel juhul ei tea uurija ette, millise seaduse järgi uuritava tunnuse vaadeldud väärtused jagunevad. Kuid tal võib olla piisavalt mõjuvaid põhjusi eeldada, et jaotus allub ühele või teisele seadusele, näiteks tava- või ühtsele seadusele. Sel juhul esitatakse järgmise vormi peamised ja alternatiivsed statistilised hüpoteesid:

    H 0: vaadeldava tunnuse jaotus allub jaotusseadusele A,

    H 1: vaadeldava tunnuse jaotus erineb A;

kus as A toimida võib üks või teine ​​jaotusseadus: normaalne, ühtlane, eksponentsiaalne jne.

Kavandatava jaotusseaduse hüpoteesi testimine toimub nn sobivuse kriteeriumide abil. Vastuvõtmise kriteeriume on mitu. Kõige universaalsem neist on Pearsoni kriteerium, kuna see on rakendatav igasuguse jaotuse korral.

-Pearsoni kriteerium

Tavaliselt erinevad empiirilised ja teoreetilised sagedused. Kas lahknevus on juhuslik? Pearsoni kriteerium vastab sellele küsimusele, kuid nagu iga statistiline kriteerium, ei tõesta see hüpoteesi paikapidavust rangelt matemaatilises mõttes, vaid ainult tuvastab selle vastavuse või mittenõustumise vaatlusandmetega teatud olulisuse tasemel.

Niisiis, ruumala valimi põhjal saadakse tunnuste väärtuste statistiline jaotus, kus on vaadeldud tunnuse väärtused, on vastavad sagedused:

Pearsoni kriteeriumi põhiolemus on kriteeriumi arvutamine järgmise valemi järgi:

kus on vaadeldavate väärtuste numbrite arv ja vastavate väärtuste teoreetilised sagedused.

On selge, et mida väiksem on erinevus , seda lähemal on empiiriline jaotus empiirilisele, seega mida väiksem on kriteeriumi väärtus, seda usaldusväärsemalt saab väita, et empiiriline ja teoreetiline jaotus alluvad samale seadusele.

Pearsoni kriteeriumi algoritm

Pearsoni kriteeriumi algoritm on lihtne ja koosneb järgmistest sammudest:

Niisiis, ainus mittetriviaalne tegevus selles algoritmis on teoreetiliste sageduste määramine. Need sõltuvad loomulikult jaotusseadusest, seega - erinevad seadused on määratletud erinevalt.

Statistiline test

Nimetatakse reeglit, mille järgi hüpotees R 0 tagasi lükatakse või aktsepteeritakse statistiline kriteerium. Kriteeriumi nimetus sisaldab reeglina tähte, mis tähistab kriteeriumis arvutatud statistilise hüpoteesi testimise algoritmi (vt punkt 4.1) lõikest 2 spetsiaalselt koostatud tunnust. Selle algoritmi tingimustes kutsutaks kriteeriumi välja "sisse-kriteerium".

Statistiliste hüpoteeside testimisel on võimalikud kahte tüüpi vead:

  • - esimest tüüpi viga(võite hüpoteesi I 0 tagasi lükata, kui see on tegelikult tõene);
  • - II tüüpi viga(võite nõustuda hüpoteesiga I 0, kui see tegelikult ei vasta tõele).

Tõenäosus a kutsutakse esimest tüüpi viga kriteeriumi olulisuse tase.

Kui selleks R tähistab II tüüpi vea tegemise tõenäosust, siis (l - R) - II tüüpi vea mittetegemise tõenäosus, mida nimetatakse kriteeriumi jõud.

Sobivus x 2 Pearson

Statistilisi hüpoteese on mitut tüüpi:

  • - jaotusseadusest;
  • - proovide homogeensus;
  • - jaotusparameetrite arvväärtused jne.

Jaotusseaduse hüpoteesi käsitleme Pearsoni x 2 sobivuse testi näitel.

Vastavuskriteerium nimetatakse statistiliseks testiks tundmatu jaotuse väidetava seaduse nullhüpoteesi testimiseks.

Pearsoni sobivuse test põhineb teatud jaotusseaduse eeldusel arvutatud vaatluste empiiriliste (vaadeldud) ja teoreetiliste sageduste võrdlusel. Hüpotees # 0 on siin sõnastatud järgmiselt: üldpopulatsioon on tavaliselt jaotunud uuritava kriteeriumi järgi.

Kriteeriumide statistilise hüpoteesi testimise algoritm #0 x 1 Pearson:

  • 1) esitame hüpoteesi R 0 - uuritava kriteeriumi järgi on üldpopulatsioon jaotunud normaalselt;
  • 2) arvutab valimi keskmise ja valimi keskmise standardhälve umbes sisse;

3) vastavalt olemasolevale proovimahule P me arvutame spetsiaalselt koostatud karakteristiku,

kus: i, - empiirilised sagedused, - teoreetilised sagedused,

P - näidissuurus,

h- intervalli väärtus (vahe kahe külgneva valiku vahel),

vaadeldava tunnuse normaliseeritud väärtused,

- tabeli funktsioon. Samuti teoreetilised sagedused

saab arvutada MS Exceli standardfunktsiooni NORMDIST abil valemi järgi ;

4) valimijaotuse järgi määrame spetsiaalselt koostatud tunnuse kriitilise väärtuse XL P

5) kui hüpotees # 0 lükatakse tagasi, kui hüpotees # 0 on aktsepteeritud.

Näide. Mõelge märgile X- mõne paranduskoloonias süüdimõistetute testimisnäitajate väärtus psühholoogilised omadused, esitatakse variatsiooniseeriana:

Olulisuse tasemel 0,05 testige normaaljaotuse hüpoteesi elanikkonnast.

1. Empiirilise jaotuse põhjal saate püstitada hüpoteesi H 0: vastavalt uuritavale kriteeriumile "testi indikaatori väärtus antud psühholoogilise tunnuse kohta" üldpopulatsioon

laste arv on normaalselt jaotunud. Alternatiivne hüpotees 1: uuritud tunnuse "selle psühholoogilise tunnuse testi indikaatori väärtus" järgi ei ole süüdimõistetute üldpopulatsioon normaalselt jaotunud.

2. Arvutage valimi numbrilised omadused:

Intervallid

x y y

X) sch

3. Arvutage spetsiaalselt koostatud tunnus j 2 . Selleks leiame eelmise tabeli eelviimasest veerust valemi abil teoreetilised sagedused ja viimasest veerust

arvutame tunnuse % 2 . Saame x 2 = 0,185.

Selguse huvides konstrueerime teoreetiliste sageduste järgi empiirilise jaotuse hulknurga ja normaalkõvera (joonis 6).

Riis. 6.

4. Määrata vabadusastmete arv s: k = 5, t = 2, s = 5-2-1 = 2.

Vastavalt tabelile või kasutades MS Exceli standardfunktsiooni "XI20BR" vabadusastmete arvu 5 = 2 ja olulisuse taseme jaoks a = 0,05 leida kriitiline kriteeriumi väärtus xl P .=5,99. Olulisuse taseme jaoks a= 0,01 kriteeriumi kriitiline väärtus X%. = 9,2.

5. Kriteeriumi vaadeldud väärtus X=0,185 vähem kui kõik leitud väärtused Hc R.-> seetõttu aktsepteeritakse hüpotees R 0 mõlemal olulisuse tasemel. Empiirilise ja teoreetilise sageduse lahknevus on ebaoluline. Seetõttu on vaatlusandmed kooskõlas populatsiooni normaalse jaotuse hüpoteesiga. Seega, vastavalt uuritud tunnusele "selle psühholoogilise tunnuse testi indikaatori väärtus" jaotub süüdimõistetute üldpopulatsioon normaalselt.

  • 1. Koryachko A.V., Kulichenko A.G. kõrgem matemaatika ja matemaatilised meetodid psühholoogias: juhend praktiline treening psühholoogiateaduskonna üliõpilastele. Rjazan, 1994.
  • 2. Nasledov A.D. Matemaatilised meetodid psühholoogilised uuringud. Andmete analüüs ja tõlgendamine: Õpik, käsiraamat. SPb., 2008.
  • 3. Sidorenko E.V. Matemaatilise töötlemise meetodid psühholoogias. SPb., 2010.
  • 4. Soshnikova L.A. jt Mitmemõõtmeline statistiline analüüs majanduses: Õpik, käsiraamat ülikoolidele. M., 1999.
  • 5. Sukhodolsky E.V. Matemaatilised meetodid psühholoogias. Harkov, 2004.
  • 6. Shmoylova R.A., Minashkin V.E., Sadovnikova N.A. Statistika teooria töötuba: Õpik, käsiraamat. M., 2009.
  • Gmurman V.E. Tõenäosusteooria ja matemaatiline statistika. S. 465.

Intervalli laius on:

Xmax – rühmitusfunktsiooni maksimaalne väärtus koondmaterjalis.
Xmin – rühmitamisfunktsiooni minimaalne väärtus.
Määratleme rühma piirid.

Grupi numberAlumine joonÜlemine piir
1 43 45.83
2 45.83 48.66
3 48.66 51.49
4 51.49 54.32
5 54.32 57.15
6 57.15 60

Sama tunnusväärtus toimib kahe külgneva (eelmise ja järgneva) rühma ülemise ja alumise piirina.
Iga seeria väärtuse jaoks arvutame, mitu korda see konkreetsesse intervalli langeb. Selleks sortige seeriad kasvavas järjekorras.
43 43 - 45.83 1
48.5 45.83 - 48.66 1
49 48.66 - 51.49 1
49 48.66 - 51.49 2
49.5 48.66 - 51.49 3
50 48.66 - 51.49 4
50 48.66 - 51.49 5
50.5 48.66 - 51.49 6
51.5 51.49 - 54.32 1
51.5 51.49 - 54.32 2
52 51.49 - 54.32 3
52 51.49 - 54.32 4
52 51.49 - 54.32 5
52 51.49 - 54.32 6
52 51.49 - 54.32 7
52 51.49 - 54.32 8
52 51.49 - 54.32 9
52.5 51.49 - 54.32 10
52.5 51.49 - 54.32 11
53 51.49 - 54.32 12
53 51.49 - 54.32 13
53 51.49 - 54.32 14
53.5 51.49 - 54.32 15
54 51.49 - 54.32 16
54 51.49 - 54.32 17
54 51.49 - 54.32 18
54.5 54.32 - 57.15 1
54.5 54.32 - 57.15 2
55.5 54.32 - 57.15 3
57 54.32 - 57.15 4
57.5 57.15 - 59.98 1
57.5 57.15 - 59.98 2
58 57.15 - 59.98 3
58 57.15 - 59.98 4
58.5 57.15 - 59.98 5
60 57.15 - 59.98 6

Rühmitamise tulemused esitatakse tabeli kujul:
RühmadrahvaarvuSagedus f i
43 - 45.83 1 1
45.83 - 48.66 2 1
48.66 - 51.49 3,4,5,6,7,8 6
51.49 - 54.32 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26 18
54.32 - 57.15 27,28,29,30 4
57.15 - 59.98 31,32,33,34,35,36 6

Tabel näitajate arvutamiseks.
Rühmadx iKogus, fix i * f iKumulatiivne sagedus, S|x - x vrd |*f(x - x sr) 2 *fSagedus, f i /n
43 - 45.83 44.42 1 44.42 1 8.88 78.91 0.0278
45.83 - 48.66 47.25 1 47.25 2 6.05 36.64 0.0278
48.66 - 51.49 50.08 6 300.45 8 19.34 62.33 0.17
51.49 - 54.32 52.91 18 952.29 26 7.07 2.78 0.5
54.32 - 57.15 55.74 4 222.94 30 9.75 23.75 0.11
57.15 - 59.98 58.57 6 351.39 36 31.6 166.44 0.17
36 1918.73 82.7 370.86 1

Jaotussarja hindamiseks leiame järgmised näitajad:
Jaotuskeskuse mõõdikud.
kaalutud keskmine


Mood
Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

kus x 0 on modaalintervalli algus; h on intervalli väärtus; f 2 -modaalintervallile vastav sagedus; f 1 - premodaalne sagedus; f 3 - postmodaalne sagedus.
Valime intervalli alguseks 51,49, kuna see intervall moodustab suurima arvu.

Seeria levinuim väärtus on 52,8
Mediaan
Mediaan jagab valimi kaheks osaks: pool varianti on mediaanist väiksem, pool rohkem.
AT intervalli seeriad jaotust, saate kohe määrata ainult intervalli, milles režiim või mediaan asub. Mediaan vastab vahemiku keskel olevale valikule. Mediaan on intervall 51,49 - 54,32, sest selles intervallis on akumuleeritud sagedus S suurem mediaanarvust (esimest intervalli nimetatakse mediaaniks, mille akumuleeritud sagedus S ületab poole sageduste kogusummast).


Seega jääb 50% rahvastikuühikutest alla 53,06
Variatsiooninäitajad.
Absoluutsed variatsioonimäärad.
Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.
R = X max - X min
R = 60-43 = 17
Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.


Iga seeria väärtus erineb teisest mitte rohkem kui 2,3 võrra
Dispersioon- iseloomustab hajuvuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).


Erapooletu dispersiooni hindaja on dispersiooni järjepidev hinnang.


Standardhälve.

Iga seeria väärtus erineb keskmisest väärtusest 53,3 mitte rohkem kui 3,21 võrra
Standardhälbe hindamine.

Variatsiooni suhtelised mõõdud.
Suhteliste variatsiooninäitajate hulka kuuluvad: võnkekoefitsient, lineaarne koefitsient variatsioonid, suhteline lineaarne hälve.
Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v ≤ 30%, on populatsioon homogeenne ja variatsioon nõrk. Saadud tulemusi võib usaldada.
Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Jaotuse tüübi hüpoteeside kontrollimine.
1. Testime hüpoteesi, et X on jaotunud tavaline seadus kasutades Pearsoni sobivuse testi.

kus p i on tabamise tõenäosus i-s intervall juhuslik muutuja, jaotatud hüpoteetilise seaduse järgi
Tõenäosuste p i arvutamiseks rakendame Laplace'i funktsiooni valemit ja tabelit

kus
s = 3,21, xav = 53,3
Teoreetiline (eeldatav) sagedus on n i = np i , kus n = 36
GrupiintervallidVaadeldav sagedus n ix 1 \u003d (x i - x cf) / sx 2 \u003d (x i + 1 - x cf) / sФ(x 1)Ф(x 2)I-nda intervalli tabamise tõenäosus, p i \u003d Ф (x 2) - Ф (x 1)Eeldatav sagedus, 36p iPearsoni statistika tingimused, K i
43 - 45.83 1 -3.16 -2.29 -0.5 -0.49 0.01 0.36 1.14
45.83 - 48.66 1 -2.29 -1.42 -0.49 -0.42 0.0657 2.37 0.79
48.66 - 51.49 6 -1.42 -0.56 -0.42 -0.21 0.21 7.61 0.34
51.49 - 54.32 18 -0.56 0.31 -0.21 0.13 0.34 12.16 2.8
54.32 - 57.15 4 0.31 1.18 0.13 0.38 0.26 9.27 3
57.15 - 59.98 6 1.18 2.06 0.38 0.48 0.0973 3.5 1.78
36 9.84

Määratleme kriitilise piirkonna piiri. Kuna Pearsoni statistika mõõdab erinevust empiirilise ja teoreetilise jaotuse vahel, siis mida suurem on selle vaadeldav K obs väärtus, seda tugevam on argument põhihüpoteesi vastu.
Seetõttu on selle statistika jaoks kriitiline piirkond alati paremakäeline :)

Seotud väljaanded

  • Milline on bronhiidi pilt Milline on bronhiidi pilt

    on difuusne progresseeruv põletikuline protsess bronhides, mis viib bronhide seina morfoloogilise restruktureerimiseni ja ...

  • HIV-nakkuse lühikirjeldus HIV-nakkuse lühikirjeldus

    Inimese immuunpuudulikkuse sündroom - AIDS, Inimese immuunpuudulikkuse viirusinfektsioon - HIV-nakkus; omandatud immuunpuudulikkus...