Arvioinnissa käytetään Pearsonin kriteerejä. Testataan hypoteesia yleisen populaation normaalijakaumasta Pearson-kriteerin mukaan

Joissakin tapauksissa tutkija ei tiedä etukäteen, minkä lain mukaan tutkittavan ominaisuuden havaitut arvot jakautuvat. Mutta hänellä voi olla tarpeeksi hyviä syitä olettaa, että jakauma on yhden tai toisen lain alainen, esimerkiksi normaali tai yhtenäinen. Tässä tapauksessa esitetään seuraavan muodon tärkeimmät ja vaihtoehtoiset tilastolliset hypoteesit:

    H 0: havaitun ominaisuuden jakautuminen on jakautumislain alaista A,

    H 1: havaitun ominaisuuden jakauma eroaa A;

missä kuin A yksi tai toinen jakautumislaki voi toimia: normaali, yhtenäinen, eksponentiaalinen jne.

Ehdotettua jakautumislakia koskevan hypoteesin testaus suoritetaan ns. sopivuuskriteereillä. Hyväksymiskriteereitä on useita. Yleisin niistä on Pearsonin kriteeri, koska se soveltuu kaikenlaiseen jakeluun.

-Pearsonin kriteeri

Yleensä empiiriset ja teoreettiset taajuudet eroavat toisistaan. Onko ero satunnainen? Pearson-kriteeri vastaa tähän kysymykseen, mutta kuten mikä tahansa tilastollinen kriteeri, se ei todista hypoteesin paikkansapitävyyttä tiukasti matemaattisessa mielessä, vaan ainoastaan ​​vahvistaa sen yhtäpitävyyden tai erimielisyyden havaintoaineiston kanssa tietyllä merkitsevyystasolla.

Otetaan siis tilavuusnäytteestä piirrearvojen tilastollinen jakauma, missä ovat havaitut piirrearvot, ovat vastaavat taajuudet:

Pearson-kriteerin ydin on laskea kriteeri seuraavan kaavan mukaan:

missä on havaittujen arvojen numeroiden lukumäärä ja ovat vastaavien arvojen teoreettiset taajuudet.

On selvää, että mitä pienempi ero on, sitä lähempänä empiirinen jakauma on empiiristä, joten mitä pienempi kriteerin arvo on, sitä luotettavammin voidaan väittää, että empiirinen ja teoreettinen jakauma ovat saman lain alaisia.

Pearsonin kriteerialgoritmi

Pearson-kriteerialgoritmi on yksinkertainen ja koostuu seuraavista vaiheista:

Joten ainoa ei-triviaali toimenpide tässä algoritmissa on teoreettisten taajuuksien määrittäminen. Ne tietysti riippuvat jakautumislaista, joten - eri lait määritellään eri tavalla.

Tilastollinen testi

Kutsutaan sääntöä, jolla hypoteesi R 0 hylätään tai hyväksytään tilastollinen kriteeri. Kriteerin nimessä on pääsääntöisesti kirjain, joka tarkoittaa kriteerissä laskettua tilastollisen hypoteesin testausalgoritmin kohdasta 2 (katso kohta 4.1) erityisesti koottua ominaisuutta. Tämän algoritmin olosuhteissa kriteeriä kutsutaan "V-kriteeri".

Tilastollisia hypoteeseja testattaessa kahden tyyppiset virheet ovat mahdollisia:

  • - ensimmäisen tyyppinen virhe(voit hylätä hypoteesin I 0, kun se on todella totta);
  • - tyypin II virhe(voit hyväksyä hypoteesin I 0, kun se ei itse asiassa pidä paikkaansa).

Todennäköisyys A tehdä tyypin yksi virhe kutsutaan kriteerin merkitystaso.

Jos varten R tarkoittaa tyypin II virheen tekemisen todennäköisyyttä, niin (l - R) - todennäköisyys, että tyypin II virhettä ei tehdä, jota kutsutaan kriteerin voima.

Sopivuus x 2 Pearson

Tilastollisia hypoteeseja on useita:

  • - jakelulakista;
  • - näytteiden homogeenisuus;
  • - jakeluparametrien numeroarvot jne.

Tarkastellaan hypoteesia jakautumislaista Pearsonin x 2 -sovitustestin esimerkissä.

Vastaavuuskriteeri kutsutaan tilastolliseksi testiksi tuntemattoman jakauman väitetyn lain nollahypoteesin testaamiseksi.

Pearsonin sopivuustesti perustuu havaintojen empiiristen (havaittujen) ja teoreettisten frekvenssien vertailuun, jotka on laskettu tietyn jakautumislain oletuksen perusteella. Hypoteesi # 0 on tässä muotoiltu seuraavasti: yleinen populaatio jakautuu normaalisti tutkittavan kriteerin mukaan.

Tilastollisen hypoteesin testausalgoritmi #0 kriteereille x 1 Pearson:

  • 1) esitämme hypoteesin R 0 - tutkittavan kriteerin mukaan yleinen populaatio jakautuu normaalisti;
  • 2) laske näytteen keskiarvo ja näytteen keskiarvo keskihajonta O V;

3) käytettävissä olevan näytemäärän mukaan P laskemme erityisesti kootun ominaisuuden,

missä: i, - empiiriset taajuudet, - teoreettiset taajuudet,

P - otoskoko,

h- intervallin arvo (kahden vierekkäisen vaihtoehdon välinen ero),

Havaitun ominaisuuden normalisoidut arvot,

- pöytätoiminto. Myös teoreettiset taajuudet

voidaan laskea MS Excelin standardifunktiolla NORMDIST kaavan mukaan;

4) näytteenottojakauman mukaan määritämme erityisesti kootun ominaisuuden kriittisen arvon XL P

5) kun hypoteesi # 0 hylätään, kun hypoteesi # 0 hyväksytään.

Esimerkki. Harkitse merkkiä X- testausindikaattoreiden arvo jossakin vankeinhoitoyhdyskunnassa olevien vankien osalta psykologiset ominaisuudet, esitetään variaatiosarjana:

Testaa normaalijakauman hypoteesia merkitsevyystasolla 0,05 väestö.

1. Empiirisen jakauman perusteella voit esittää hypoteesin H 0: tutkittavan kriteerin mukaan "tietyn psykologisen ominaisuuden testiindikaattorin arvo", yleinen väestö

lasten määrä jakautuu normaalisti. Vaihtoehtoinen hypoteesi 1: Tutkitun ominaisuuden "tämän psykologisen ominaisuuden testiindikaattorin arvo" mukaan vankien yleinen populaatio ei ole normaalisti jakautunut.

2. Laske numeeriset näytteen ominaisuudet:

Intervallit

x y y

X) sch

3. Laske erityisesti muodostettu ominaisuus j 2 . Tätä varten löydämme edellisen taulukon toiseksi viimeisestä sarakkeesta teoreettiset taajuudet kaavan avulla ja viimeisestä sarakkeesta

lasketaan ominaisuus % 2 . Saamme x 2 = 0,185.

Selvyyden vuoksi rakennamme empiirisen jakauman polygonin ja normaalikäyrän teoreettisten taajuuksien mukaan (kuva 6).

Riisi. 6.

4. Määritä vapausasteiden lukumäärä s: k = 5, t = 2, s = 5-2-1 = 2.

Taulukon mukaan tai käyttämällä MS Excelin standardifunktiota "XI20BR" vapausasteiden lukumäärälle 5 = 2 ja merkitsevyystasolle a = 0,05 löytää kriittinen kriteerin arvo xl P .=5,99. Merkitystasolle A= 0,01 kriteerin kriittinen arvo X %. = 9,2.

5. Kriteerin havaittu arvo X=0,185 vähemmän kuin kaikki löydetyt arvot Hc R.-> siksi hypoteesi R 0 hyväksytään molemmilla merkitsevyystasoilla. Empiirisen ja teoreettisen taajuuden välinen ero on merkityksetön. Siksi havainnointitiedot ovat yhdenmukaisia ​​normaalin populaatiojakauman hypoteesin kanssa. Siten tutkitun ominaisuuden "tämän psykologisen ominaisuuden testiindikaattorin arvo" mukaan vankien yleinen populaatio jakautuu normaalisti.

  • 1. Koryachko A.V., Kulichenko A.G. korkeampi matematiikka ja matemaattiset menetelmät psykologiassa: opas käytännön harjoittelu psykologian tiedekunnan opiskelijoille. Ryazan, 1994.
  • 2. Nasledov A.D. Matemaattiset menetelmät psykologinen tutkimus. Aineiston analysointi ja tulkinta: Oppikirja, käsikirja. SPb., 2008.
  • 3. Sidorenko E.V. Matemaattisen käsittelyn menetelmät psykologiassa. SPb., 2010.
  • 4. Soshnikova L.A. ja muut Monimuuttujatilastoanalyysi taloudessa: Oppikirja, käsikirja yliopistoille. M., 1999.
  • 5. Sukhodolsky E.V. Matemaattiset menetelmät psykologiassa. Harkova, 2004.
  • 6. Shmoylova R.A., Minashkin V.E., Sadovnikova N.A. Tilastoteorian työpaja: Oppikirja, käsikirja. M., 2009.
  • Gmurman V.E. Todennäköisyysteoria ja matemaattiset tilastot. S. 465.

Välin leveys on:

Xmax - ryhmittelyominaisuuden enimmäisarvo aggregaatissa.
Xmin - ryhmittelyattribuutin vähimmäisarvo.
Määritellään ryhmän rajat.

Ryhmän numeroBottom lineYläraja
1 43 45.83
2 45.83 48.66
3 48.66 51.49
4 51.49 54.32
5 54.32 57.15
6 57.15 60

Sama ominaisuuden arvo toimii kahden vierekkäisen (edellisen ja seuraavan) ryhmän ylä- ja alarajana.
Jokaiselle sarjan arvolle lasketaan, kuinka monta kertaa se osuu tiettyyn väliin. Voit tehdä tämän lajittelemalla sarjat nousevaan järjestykseen.
43 43 - 45.83 1
48.5 45.83 - 48.66 1
49 48.66 - 51.49 1
49 48.66 - 51.49 2
49.5 48.66 - 51.49 3
50 48.66 - 51.49 4
50 48.66 - 51.49 5
50.5 48.66 - 51.49 6
51.5 51.49 - 54.32 1
51.5 51.49 - 54.32 2
52 51.49 - 54.32 3
52 51.49 - 54.32 4
52 51.49 - 54.32 5
52 51.49 - 54.32 6
52 51.49 - 54.32 7
52 51.49 - 54.32 8
52 51.49 - 54.32 9
52.5 51.49 - 54.32 10
52.5 51.49 - 54.32 11
53 51.49 - 54.32 12
53 51.49 - 54.32 13
53 51.49 - 54.32 14
53.5 51.49 - 54.32 15
54 51.49 - 54.32 16
54 51.49 - 54.32 17
54 51.49 - 54.32 18
54.5 54.32 - 57.15 1
54.5 54.32 - 57.15 2
55.5 54.32 - 57.15 3
57 54.32 - 57.15 4
57.5 57.15 - 59.98 1
57.5 57.15 - 59.98 2
58 57.15 - 59.98 3
58 57.15 - 59.98 4
58.5 57.15 - 59.98 5
60 57.15 - 59.98 6

Ryhmittelyn tulokset esitetään taulukon muodossa:
ryhmätväestömääräTaajuus f i
43 - 45.83 1 1
45.83 - 48.66 2 1
48.66 - 51.49 3,4,5,6,7,8 6
51.49 - 54.32 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26 18
54.32 - 57.15 27,28,29,30 4
57.15 - 59.98 31,32,33,34,35,36 6

Taulukko indikaattoreiden laskemista varten.
ryhmätx iMäärä, fix i * f iKumulatiivinen taajuus, S|x - x cf |*f(x - x sr) 2 *fTaajuus, f i/n
43 - 45.83 44.42 1 44.42 1 8.88 78.91 0.0278
45.83 - 48.66 47.25 1 47.25 2 6.05 36.64 0.0278
48.66 - 51.49 50.08 6 300.45 8 19.34 62.33 0.17
51.49 - 54.32 52.91 18 952.29 26 7.07 2.78 0.5
54.32 - 57.15 55.74 4 222.94 30 9.75 23.75 0.11
57.15 - 59.98 58.57 6 351.39 36 31.6 166.44 0.17
36 1918.73 82.7 370.86 1

Jakaumasarjan arvioimiseksi löydämme seuraavat indikaattorit:
Jakelukeskuksen mittarit.
painotettu keskiarvo


Muoti
Tila on ominaisuuden yleisin arvo tietyn populaation yksiköissä.

missä x 0 on modaalivälin alku; h on intervallin arvo; f2 - modaaliväliä vastaava taajuus; f1 - premodaalinen taajuus; f 3 - postmodaalinen taajuus.
Valitsemme 51.49 intervallin alkajaksi, koska tämä väli on suurin luku.

Sarjan yleisin arvo on 52,8
Mediaani
Mediaani jakaa otoksen kahteen osaan: puolet vaihtoehdosta on pienempi kuin mediaani, puolet enemmän.
SISÄÄN intervallisarja jakauman, voit määrittää välittömästi vain välin, jossa tila tai mediaani sijoittuu. Mediaani vastaa alueen keskellä olevaa vaihtoehtoa. Mediaani on väli 51,49 - 54,32, koska tällä aikavälillä kertynyt taajuus S on suurempi kuin mediaaniluku (ensimmäistä väliä kutsutaan mediaaniksi, jonka kumuloitunut taajuus S ylittää puolet taajuuksien kokonaissummasta).


Näin ollen 50 % väestöyksiköistä on alle 53,06
Vaihtelun indikaattorit.
Absoluuttiset vaihtelut.
Vaihteluväli on ero ensisijaisen sarjan attribuutin maksimi- ja vähimmäisarvojen välillä.
R = X max - X min
R = 60 - 43 = 17
Keskimääräinen lineaarinen poikkeama- laskettu siten, että otetaan huomioon tutkitun perusjoukon kaikkien yksiköiden erot.


Jokainen sarjan arvo eroaa toisistaan ​​enintään 2,3
Dispersio- luonnehtii leviämisen mittaa sen keskiarvon ympärillä (dispersion mitta eli poikkeama keskiarvosta).


Puolueeton varianssiestimaattori on johdonmukainen arvio varianssista.


Standardipoikkeama.

Sarjan kukin arvo eroaa keskiarvosta 53,3 enintään 3,21
Keskihajonnan arviointi.

Suhteelliset vaihtelumitat.
Suhteellisia vaihteluindikaattoreita ovat: värähtelykerroin, lineaarinen kerroin vaihtelut, suhteellinen lineaarinen poikkeama.
Variaatiokerroin- populaatioarvojen suhteellisen leviämisen mitta: osoittaa, kuinka suuri osuus tämän suuren keskiarvosta on sen keskimääräinen leviäminen.

Koska v ≤ 30%, populaatio on homogeeninen ja vaihtelu on heikko. Saavutettuihin tuloksiin voi luottaa.
Lineaarinen variaatiokerroin tai Suhteellinen lineaarinen poikkeama- kuvaa absoluuttisten poikkeamien etumerkin keskiarvon osuutta keskiarvosta.

Hypoteesien testaus jakauman tyypistä.
1. Testataan hypoteesia, että X on jakautunut normaali laki käyttäen Pearsonin sopivuustestiä.

missä p i on osumisen todennäköisyys i. intervalli Satunnaismuuttuja, jaettu hypoteettisen lain mukaan
Todennäköisyyksien p i laskemiseen käytetään Laplacen funktion kaavaa ja taulukkoa

Missä
s = 3,21, xav = 53,3
Teoreettinen (odotettu) taajuus on n i = np i , missä n = 36
RyhmävälitHavaittu taajuus n ix 1 \u003d (x i - x cf) / sx 2 \u003d (x i + 1 - x cf) / sФ(x 1)Ф(x 2)i:nnen välin osumisen todennäköisyys, p i \u003d Ф (x 2) - Ф (x 1)Odotettu taajuus, 36p iPearson-tilaston ehdot, K i
43 - 45.83 1 -3.16 -2.29 -0.5 -0.49 0.01 0.36 1.14
45.83 - 48.66 1 -2.29 -1.42 -0.49 -0.42 0.0657 2.37 0.79
48.66 - 51.49 6 -1.42 -0.56 -0.42 -0.21 0.21 7.61 0.34
51.49 - 54.32 18 -0.56 0.31 -0.21 0.13 0.34 12.16 2.8
54.32 - 57.15 4 0.31 1.18 0.13 0.38 0.26 9.27 3
57.15 - 59.98 6 1.18 2.06 0.38 0.48 0.0973 3.5 1.78
36 9.84

Määritellään kriittisen alueen raja. Koska Pearson-tilasto mittaa eroa empiirisen ja teoreettisen jakauman välillä, mitä suurempi sen havaittu K obs -arvo, sitä vahvempi argumentti päähypoteesia vastaan.
Siksi tämän tilaston kriittinen alue on aina oikeakätinen :)

Aiheeseen liittyvät julkaisut