Kriteeriumi kriitilise väärtuse t leiab tabelist. Studenti t-testi jaotus keskmise hüpoteesi kontrollimiseks ja usaldusvahemiku arvutamiseks MS Excelis

Statistilise hüpoteesi testimine võimaldab teha valimiandmete põhjal range järelduse üldkogumi omaduste kohta. Hüpoteesid on erinevad. Üks neist on hüpotees keskmise kohta (matemaatiline ootus). Selle olemus on teha õige järeldus selle kohta, kus üldkeskmine võib põhineda või mitte ainult olemasoleva valimi põhjal (täpset tõde ei saa me kunagi teada, kuid saame otsinguringi kitsendada).

Kirjeldatakse üldist lähenemist hüpoteeside kontrollimisele, seega otse asja juurde. Oletame esmalt, et valim on koostatud tavalisest juhuslike muutujate hulgast Xüldise keskmisega μ ja dispersioon σ2(Ma tean, ma tean, et seda ei juhtu, aga te ei pea mind segama!). Selle valimi aritmeetiline keskmine on ilmselgelt ise juhuslik suurus. Kui eraldame palju selliseid valimeid ja arvutame nende jaoks keskmised, siis on neil ka matemaatiline ootus μ ja

Siis juhuslik suurus

Tekib küsimus: kas üldkeskmine tõenäosusega 95% jääb vahemikku ±1,96 s x̅. Teisisõnu on juhuslike muutujate jaotused

samaväärne.

Esimest korda tõstatas selle küsimuse (ja lahendas) keemik, kes töötas Guinnessi õlletehases Dublinis (Iirimaa). Keemiku nimi oli William Seeley Gosset ja ta võttis keemiliseks analüüsiks õlleproove. Mingil hetkel hakkas William ilmselt kahtlema keskmiste jaotuse suhtes. See osutus veidi laialivalguvamaks, kui tavajaotus peaks olema.

Pärast matemaatilise põhjenduse kogumist ja leitud jaotusfunktsiooni väärtuste arvutamist kirjutas Dublini keemik William Gosset märkuse, mis avaldati ajakirja Biometrics 1908. aasta märtsinumbris (peatoimetaja Karl Pearson). . Sest Guinness keelas rangelt õlle valmistamise saladusi välja anda, Gosset allkirjastas pseudonüümi Student.

Vaatamata sellele, et K. Pearson oli distributsiooni juba leiutanud, domineeris siiski üldine normaalsuse idee. Keegi ei kavatsenud arvata, et valimi hinnangute jaotus ei pruugi olla normaalne. Seetõttu jäi W. Gosseti artikkel praktiliselt märkamatuks ja unustusse. Ja ainult Ronald Fisher hindas Gosseti avastust. Fischer kasutas uut distributsiooni oma töös ja andis sellele nime Tudengi t-jaotus. Hüpoteeside kontrollimise kriteeriumiks sai vastavalt Üliõpilase t-test. Nii toimus statistikas "revolutsioon", mis astus näidisandmete analüüsi ajastusse. See oli lühike põik ajalukku.

Vaatame, mida W. Gosset nägi. Genereerime 20 tuhat normaalproovi 6 vaatlusest keskmisega ( ) 50 ja standardhälve ( σ ) 10. Seejärel normaliseerime valimi keskväärtusi kasutades üldine dispersioon:

Saadud 20 tuhat keskmist rühmitame 0,1 pikkusteks intervallideks ja arvutame sagedused. Joonistame diagrammile valimi keskmiste tegelikud (Norm) ja teoreetilised (ENorm) sagedusjaotused.

Punktid (vaadeldud sagedused) langevad peaaegu kokku joonega (teoreetilised sagedused). See on arusaadav, sest andmed on võetud samast üldkogumist ja erinevused on vaid valimivead.

Teeme uue katse. Normaliseerime keskmised kasutades valimi dispersioon.

Loendame uuesti sagedused ja joonistame need diagrammile punktidena, jättes võrdluseks standardse normaaljaotuse joone. Tähistame keskmiste empiirilist sagedust näiteks tähe kaudu t.

On näha, et seekordsed jaotused ei ole väga sarnased. Sulge, jah, kuid mitte sama. Sabad on muutunud "raskemaks".

Gosset-Studentil polnud MS Exceli uusimat versiooni, kuid just seda efekti ta märkas. Miks see nii on? Seletus on see, et juhuslik muutuja

ei sõltu ainult valimiveast (lugejast), vaid ka keskmise (nimetaja) standardveast, mis on samuti juhuslik suurus.

Mõelgem veidi, milline jaotus peaks sellisel juhuslikul muutujal olema. Esiteks peate midagi matemaatilisest statistikast meeles pidama (või õppima). On olemas selline Fisheri teoreem, mis ütleb, et normaaljaotusest pärinevas valimis:

1. keskmine ja valimi dispersioon s2 on sõltumatud suurused;

2. Valimi ja üldise dispersiooni suhtel, korrutatuna vabadusastmete arvuga, on jaotus χ 2(hii-ruut) sama arvu vabadusastmetega, s.o.

kus k- vabadusastmete arv (inglise keeles grades of freedom (d.f.))

Sellel seadusel põhinevad ka paljud teised normaalmudelite statistika tulemused.

Tuleme tagasi keskmise jaotuse juurde. Jagage avaldise lugeja ja nimetaja

peal σX̅. Hangi

Lugeja on tavaline tavaline juhuslik muutuja (tähistame ξ (xi)). Nimetajat saab väljendada Fisheri teoreemist.

Seejärel võtab algne väljend kuju

See on üldiselt (õpilaste suhtarv). Selle jaotusfunktsiooni on juba võimalik otse tuletada, sest mõlema juhusliku muutuja jaotus selles avaldises on teada. Jätame selle naudingu matemaatikutele.

Studenti t-jaotuse funktsioonil on valem, millest on üsna raske aru saada, mistõttu pole mõtet seda sõeluda. Igatahes keegi ei kasuta seda, sest. tõenäosused esitatakse spetsiaalsetes Studenti jaotuse tabelites (mida mõnikord nimetatakse ka Studenti koefitsientide tabeliteks) või haamritakse need PC valemiteks.

Seega, olles relvastatud uute teadmistega, saate aru Studenti levitamise ametlikust määratlusest.
Juhuslik suurus, mis järgib Studenti jaotust koos k vabadusastmed on sõltumatute juhuslike suuruste suhe

kus ξ jaotatakse standardse normaalseaduse järgi ja χ 2k allub levitamisele χ 2 c k vabadusastmed.

Seega Studenti kriteeriumi aritmeetilise keskmise valem

Üliõpilassuhte puhul on erijuhtum

Valemist ja definitsioonist järeldub, et Studenti t-testi jaotus sõltub ainult vabadusastmete arvust.

Kell k> 30 t-test praktiliselt ei erine standardsest normaaljaotusest.

Erinevalt hii-ruudust võib t-test olla ühe- või kahesabaline. Tavaliselt kasutatakse kahepoolset, eeldades, et kõrvalekalle võib esineda mõlemas suunas keskmisest. Aga kui probleemi olukord lubab kõrvalekaldumist ainult ühes suunas, siis on mõistlik rakendada ühekülgset kriteeriumi. See suurendab veidi võimsust, tk. fikseeritud olulisuse tasemel läheneb kriitiline väärtus veidi nullile.

Studenti t-testi rakendamise tingimused

Vaatamata sellele, et Studenti avastus tegi omal ajal statistikas revolutsiooni, on t-testi rakendatavus siiski üsna piiratud, sest ise tuleneb algandmete normaaljaotuse eeldusest. Kui andmed ei ole normaalsed (mis tavaliselt on nii), siis t-testil ei ole enam Studenti jaotust. Keskpiiri teoreemi toime tõttu omandab keskmine isegi mittenormaalsete andmete korral kiiresti kellukesekujulise jaotuse.

Mõelge näiteks andmetele, millel on väljendunud kalduvus paremale, näiteks 5 vabadusastmega hii-ruutjaotus.

Nüüd loome 20 tuhat valimit ja jälgime, kuidas muutub vahendite jaotus sõltuvalt nende suurusest.

Erinevus on üsna märgatav väikestes proovides, kuni 15–20 vaatlust. Siis aga kaob see kiiresti. Seega ei ole jaotuse ebanormaalsus muidugi hea, aga ka mitte kriitiline.

Kõige enam “kardab” t-kriteeriumi kõrvalekaldeid, st. ebanormaalsed kõrvalekalded. Võtame 20 tuhat tavalist valimit 15 vaatlusest ja lisame mõnele neist ühe juhusliku kõrvalekalde.

Pilt on õnnetu. Keskmiste tegelikud sagedused on väga erinevad teoreetilistest. T-jaotuse kasutamine muutub sellises olukorras väga riskantseks ettevõtmiseks.

Nii et mitte väga väikestes valimites (15 vaatlusest) on t-test suhteliselt vastupidav algandmete mittenormaalsele jaotusele. Kuid andmetes esinevad kõrvalekalded moonutavad tugevalt t-testi jaotust, mis omakorda võib viia statistiliste järelduste vigadeni, seega tuleks kõrvale jätta anomaalsed vaatlused. Sageli eemaldatakse proovist kõik väärtused, mis jäävad keskmisest väljapoole ±2 standardhälvet.

Näide matemaatilise ootuse hüpoteesi testimisest Studenti t-testi abil MS Excelis

Excelil on mitu t-jaotusega seotud funktsiooni. Vaatleme neid.

STUDENT.DIST - "klassikaline" vasakpoolne Studenti t-jaotus. Sisend on t-kriteeriumi väärtus, vabadusastmete arv ja valik (0 või 1), mis määrab, mida on vaja arvutada: funktsiooni tihedus või väärtus. Väljundis saame vastavalt tiheduse või tõenäosuse, et juhuslik suurus on väiksem kui argumendis määratud t-kriteerium.

STUDENT.DIST.2X - kahesuunaline jaotus. Argumendiks on antud t-kriteeriumi absoluutväärtus (moodul) ja vabadusastmete arv. Väljundis saame tõenäosuse saada see või isegi rohkem t-kriteeriumi väärtust, s.t. tegelik olulisuse tase (p-tase).

STUDENT.DIST.RH - parempoolne t-jaotus. Niisiis, 1-ÕPILAS.KAUG(2;5;1) = ÕPILAS.KAUG.PX(2;5) = 0,05097. Kui t-test on positiivne, on tulemuseks p-tase.

STUDENT.INV – kasutatakse t-jaotuse vasakpoolse pöördarvu arvutamiseks. Argumendiks on tõenäosus ja vabadusastmete arv. Väljundis saame sellele tõenäosusele vastava t-kriteeriumi väärtuse. Tõenäosus loetakse vasakule. Seetõttu on vasaku saba jaoks vajalik olulisuse tase ise α ja paremale 1 - α .

STUDENT.ORD.2X on kahe sabaga Studenti jaotuse pöördväärtus, st. t-testi väärtus (modulo). Sisendina antakse ka olulisuse tase. α . Ainult seekord toimub pöördloendus mõlemalt poolt korraga, nii et tõenäosus jaguneb kahe saba peale. Niisiis, STUDENT.OBR (1-0,025; 5) \u003d STUDENT. OBR. 2X (0,05; 5) \u003d 2,57058

STUDENT.TEST on funktsioon matemaatiliste ootuste võrdsuse hüpoteesi kontrollimiseks kahes valimis. Asendab hulga arvutusi, sest. piisab, kui määrata ainult kaks vahemikku andmetega ja veel paar parameetrit. Väljund on p-tasemel.

ÕPILASTE KONFIDENTSIOON - keskmise usaldusvahemiku arvutamine, võttes arvesse t-jaotust.

Vaatleme sellist koolituse näidet. Ettevõte pakendab tsementi 50 kg kottidesse. Ühes kotis on juhuse tõttu lubatud mõningane kõrvalekalle eeldatavast massist, kuid üldine keskmine peaks jääma 50 kg. Kvaliteedikontrolli osakond kaalus juhuslikult 9 kotti ja sai järgmised tulemused: keskmine kaal ( ) oli 50,3 kg, standardhälve ( s) - 0,5 kg.

Kas tulemus on kooskõlas nullhüpoteesiga, et üldine keskmine on 50 kg? Ehk siis kas sellist tulemust on võimalik saada puhtjuhuslikult, kui seadmed töötavad korralikult ja toodavad keskmiselt 50 kg täidist? Kui hüpoteesi ei lükata ümber, siis mahub saadud erinevus juhuslike kõikumiste vahemikku, kui aga hüpotees ümber lükata, siis on suure tõenäosusega kotte täitva aparaadi seadistustes tekkinud rike. Seda tuleb kontrollida ja reguleerida.

Lühitingimus üldtunnustatud tähistuses näeb välja selline.

H0: μ = 50 kg

H1: μ ≠ 50 kg

On põhjust eeldada, et koti täituvuse jaotus järgib normaaljaotust (või ei erine sellest palju). Seega võite matemaatilise ootuse hüpoteesi testimiseks kasutada Studenti t-testi. Juhuslikud kõrvalekalded võivad esineda mõlemas suunas, seega on vaja kahepoolset t-testi.

Esiteks rakendame veevoolueelseid vahendeid: t-testi käsitsi arvutamine ja selle võrdlemine kriitilise tabeli väärtusega. Hinnanguline t-test:

Nüüd teeme kindlaks, kas saadud arv ületab olulisuse tasemel kriitilist piiri α = 0,05. Kasutame Studenti t-jaotuse tabelit (saadaval igas statistikaõpikus).

Veerud näitavad jaotuse parema külje tõenäosust, read näitavad vabadusastmete arvu. Meid huvitab kahepoolne t-test, mille olulisusnivoo on 0,05, mis on võrdne t-väärtusega poole olulisuse tasemest paremal: 1 - 0,05 / 2 = 0,975. Vabadusastmete arv on valimi suurus miinus 1, s.o. 9 - 1 = 8. Ristmikul leiame t-testi tabeliväärtuse - 2,306. Kui kasutaksime standardset normaaljaotust, siis oleks kriitiline punkt 1,96, kuid siin on seda rohkem, sest t-jaotus väikestel proovidel on lamedama kujuga.

Võrdleme tegelikku (1,8) ja tabeliväärtust (2,306). Arvutatud kriteerium osutus väiksemaks kui tabel. Seetõttu ei ole olemasolevad andmed vastuolus H 0 hüpoteesiga, et üldine keskmine on 50 kg (aga ei tõesta ka seda). See on kõik, mida saame tabelite abil teada saada. Muidugi võite ikkagi proovida p-taset leida, kuid see on ligikaudne. Ja reeglina kasutatakse hüpoteeside kontrollimiseks p-taset. Liigume siis edasi Exceli juurde.

Excelis pole t-testi arvutamiseks valmis funktsiooni. Kuid see pole hirmutav, sest Studenti t-testi valem on üsna lihtne ja seda saab hõlpsasti otse Exceli lahtrisse ehitada.

Sain sama 1.8. Leiame esmalt kriitilise väärtuse. Võtame alfa 0,05, kriteerium on kahepoolne. Kahepoolse hüpoteesi STUDENT.OBR.2X jaoks vajame funktsiooni t-jaotuse pöördväärtusest.

Saadud väärtus lõikab kriitilise piirkonna ära. Vaadeldud t-test sellesse ei satu, seega hüpoteesi ei lükata tagasi.

See on aga sama viis tabeliväärtusega hüpoteesi testimiseks. Informatiivsem saab olema p-taseme arvutamine, s.t. tõenäosus saada vaadeldav või isegi suurem kõrvalekalle 50kg keskmisest, kui see hüpotees on õige. Kahepoolse hüpoteesi STUDENT.DIST.2X jaoks vajate Studenti jaotusfunktsiooni.

P-tase võrdub 0,1096-ga, mis on suurem kui lubatud olulisuse tase 0,05 – me ei lükka hüpoteesi ümber. Kuid nüüd saame otsustada tõendite taseme üle. P-tase osutus hüpoteesi ümberlükkamisel üsna lähedale tasemele ja see toob kaasa erinevaid mõtteid. Näiteks see, et valim oli olulise kõrvalekalde tuvastamiseks liiga väike.

Oletame, et mõne aja pärast otsustas kontrolliosakond uuesti kontrollida, kuidas kottide täitmise standardit hoiti. Suurema töökindluse huvides valiti seekord välja mitte 9, vaid 25 kotti. Intuitiivselt on selge, et keskmise levik väheneb ja seetõttu suureneb tõenäosus süsteemis rikke leidmiseks.

Oletame, et proovi jaoks saadi samad keskmise ja standardhälbe väärtused kui esimesel korral (vastavalt 50,3 ja 0,5). Arvutame t-testi.


24 vabadusastme ja α = 0,05 kriitiline väärtus on 2,064. Alloleval pildil on näha, et t-test langeb hüpoteesi tagasilükkamise piirkonda.

Sellest võib järeldada, et enam kui 95% usaldustõenäosusega erineb üldine keskmine 50 kg-st. Et olla veenvam, vaatame p-taset (tabeli viimane rida). Selle või isegi suurema kõrvalekaldega 50-st keskmise saamise tõenäosus, kui hüpotees on õige, on 0,0062 ehk 0,62%, mis ühe mõõtmise korral on praktiliselt võimatu. Üldiselt lükkame hüpoteesi ümber kui ebatõenäolise.

Usaldusintervalli arvutamine Studenti t-jaotuse abil

Teine hüpoteeside testimisega tihedalt seotud statistiline meetod on usaldusvahemike arvutamine. Kui nullhüpoteesile vastav väärtus jääb saadud intervallisse, siis on see samaväärne sellega, et nullhüpoteesi ei lükata tagasi. Vastasel juhul lükatakse hüpotees sobiva usaldusnivooga tagasi. Mõnel juhul ei kontrolli analüütikud hüpoteese klassikalisel kujul üldse, vaid arvutavad ainult usaldusvahemikke. See lähenemisviis võimaldab teil saada veelgi kasulikku teavet.

Arvutame 9 ja 25 vaatluse keskmise usaldusvahemikud. Selleks kasutame Exceli funktsiooni TRUST.STUDENT. Kummalisel kombel on siin kõik üsna lihtne. Funktsiooni argumentides peate määrama ainult olulisuse taseme α , valimi standardhälve ja valimi suurus. Väljundis saame usaldusvahemiku poollaiuse ehk väärtuse, mis tuleb keskmisest mõlemal poolel kõrvale jätta. Pärast arvutuste tegemist ja visuaalse diagrammi koostamist saame järgmise.

Nagu näha, jääb 9 vaatlusega valimi puhul väärtus 50 usaldusvahemikku (hüpoteesi ei lükka ümber) ja 25 vaatluse puhul ei lange (hüpotees lükatakse tagasi). Samas võib 25 kotiga katses väita, et 97,5% tõenäosusega ületab üldkeskmine 50,1 kg (usaldusvahemiku alumine piir on 50,094 kg). Ja see on päris väärtuslik teave.

Seega lahendasime sama probleemi kolmel viisil:

1. Iidne lähenemine, t-kriteeriumi arvutatud ja tabeliväärtuse võrdlemine
2. Kaasaegsem, arvutades p-taseme, lisades hüpoteesi ümberlükkamisel teatud kindlustunde.
3. Veelgi informatiivsem, arvutades usaldusvahemiku ja saades üldise keskmise miinimumväärtuse.

Oluline on meeles pidada, et t-test viitab parameetrilistele meetoditele, sest põhineb normaaljaotusel (sellel on kaks parameetrit: keskmine ja dispersioon). Seetõttu on selle edukaks rakendamiseks oluline vähemalt algandmete ligikaudne normaalsus ja kõrvalekallete puudumine.

Lõpetuseks teen ettepaneku vaadata videot, kuidas Excelis Studenti t-testiga seotud arvutusi teha.

Meetod võimaldab teil testida hüpoteesi, mille kohaselt võrreldi kahe üldpopulatsiooni keskmisi väärtusi sõltuv proovid on üksteisest erinevad. Sõltuvuse eeldus tähendab enamasti seda, et tunnust mõõdetakse samas valimis kaks korda, näiteks enne ja pärast kokkupuudet. Üldjuhul määratakse ühe valimi igale esindajale esindaja teisest valimist (need on paarikaupa kombineeritud), nii et need kaks andmeseeriat on üksteisega positiivses korrelatsioonis. Valimite nõrgemad sõltuvustüübid: valim 1 - abikaasad, valim 2 - nende naised; valim 1 - üheaastased lapsed, valimi 2 moodustavad 1. valimi laste kaksikud jne.

Kontrollitav statistiline hüpotees, nagu eelmisel juhul, H 0: M1 = M2(valimi 1 ja 2 keskmised väärtused on võrdsed). Kui see tagasi lükatakse, aktsepteeritakse alternatiivset hüpoteesi, et M 1 enam-vähem) M 2 .

Esialgsed oletused statistilise kontrolli jaoks:

□ igale ühe valimi esindajale (ühest üldkogumist) määratakse teise valimi (teise üldkogumi) esindaja;

□ kahe valimi andmed on positiivses korrelatsioonis (paaritud);

□ uuritava tunnuse jaotus mõlemas valimis vastab normaalseadusele.

Esialgne andmestruktuur: iga objekti kohta (iga paari kohta) on uuritava tunnuse kaks väärtust.

Piirangud: tunnuse jaotus mõlemas valimis ei tohiks oluliselt erineda tavalisest; ühele ja teisele proovile vastava kahe mõõtmise andmed on positiivses korrelatsioonis.

Alternatiivid: T-Wilcoxoni test, kui vähemalt ühe proovi jaotus erineb oluliselt tavalisest; t-õpilastest sõltumatute valimite jaoks – kui kahe valimi andmed ei korreleeru positiivselt.

Valem Studenti t-testi empiiriline väärtus peegeldab asjaolu, et erinevusanalüüsi ühik on erinevus (nihe) funktsiooni väärtused iga vaatluspaari jaoks. Sellest lähtuvalt arvutatakse esmalt erinevus iga N paari tunnusväärtuste puhul d i \u003d x 1 i - x 2 i.

(3) kus M d on väärtuste keskmine erinevus; σ d on erinevuste standardhälve.

Arvutamise näide:

Oletame, et koolituse efektiivsuse testimise käigus esitati igale 8 grupi liikmele küsimus "Kui sageli teie arvamused grupi arvamusega kokku langevad?" - kaks korda, enne ja pärast treeningut. Vastuste jaoks kasutati 10-pallilist skaalat: 1 - mitte kunagi, 5 - pooltel juhtudel, 10 - alati. Kontrolliti hüpoteesi, et koolituse tulemusena tõuseb osalejate enesehinnang vastavusele (soov olla nagu teised grupis) (α = 0,05). Teeme vahearvutuste tabeli (tabel 3).

Tabel 3

Erinevuse M d = (-6)/8= -0,75 aritmeetiline keskmine. Lahutage see väärtus igast d-st (tabeli eelviimane veerg).

Standardhälbe valem erineb ainult selle poolest, et X asemel on d. Asendame kõik vajalikud väärtused, saame

σd = 0,886.

Samm 1. Arvutage kriteeriumi empiiriline väärtus valemi (3) abil: keskmine erinevus M d= -0,75; standardhälve σ d = 0,886; t e = 2,39; df = 7.

Etapp 2. Määrame p-olulisuse taseme Studenti t-testi kriitiliste väärtuste tabelist. Kui df = 7, on empiiriline väärtus p = 0,05 ja p - 0,01 kriitiliste väärtuste vahel. Seetõttu lk< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Samm 3. Teeme statistilise otsuse ja sõnastame järelduse. Statistiline hüpotees, et keskmised on võrdsed, lükatakse tagasi. Järeldus: osalejate koolitusjärgse vastavuse enesehindamise näitaja tõusis statistiliselt oluliselt (olulisuse tasemel lk< 0,05).

Parameetrilised meetodid hõlmavad kahe valimi dispersioonide võrdlemine kriteeriumi järgi F-Fischer. Mõnikord viib see meetod väärtuslike sisukate järeldusteni ja sõltumatute valimite keskmiste võrdlemise korral on dispersioonide võrdlus kohustuslik menetlust.

Arvutada F emp tuleb leida kahe valimi dispersioonide suhe ja nii, et suurem dispersioon oleks lugejas ja väiksem nimetaja.

Dispersioonide võrdlus. Meetod võimaldab testida hüpoteesi, et kahe üldpopulatsiooni, millest võrreldavad proovid eraldatakse, dispersioonid erinevad üksteisest. Kontrollitud statistiline hüpotees H 0: σ 1 2 = σ 2 2 (variatsioon valimis 1 võrdub dispersiooniga valimis 2). Kui see tagasi lükatakse, aktsepteeritakse alternatiivset hüpoteesi, et üks dispersioon on suurem kui teine.

Esialgsed oletused: kaks valimit võetakse juhuslikult erinevatest üldpopulatsioonidest, millel on uuritava tunnuse normaalne jaotus.

Esialgne andmestruktuur: uuritavat tunnust mõõdetakse objektides (subjektides), millest igaüks kuulub ühte kahest võrreldavast valimist.

Piirangud: Tunnuse jaotused mõlemas valimis ei erine oluliselt tavalisest.

Alternatiivne meetod: Levene "sTest test, mille rakendamine ei nõua normaalsuse eelduse kontrollimist (kasutatakse SPSS programmis).

Valem F-Fisheri testi empiirilise väärtuse jaoks:

(4)

kus σ 1 2 - suur dispersioon ja σ 2 2 - väiksem dispersioon. Kuna pole ette teada, kumb dispersioon on suurem, siis p-taseme määramiseks, Mittesuunatud alternatiivide kriitiliste väärtuste tabel. Kui a F e > F Kp vastava arvu vabadusastmete jaoks, siis R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Arvutamise näide:

Lastele anti tavalised aritmeetilised ülesanded, mille järel öeldi ühele juhuslikult valitud poolele õpilastest, et nad ei ole testi sooritanud, ülejäänud aga vastupidi. Seejärel küsiti igalt lapselt, mitu sekundit tal kulub sarnase probleemi lahendamiseks. Eksperimenteerija arvutas välja lapse kutsutud aja ja sooritatud ülesande tulemuse vahe (sekundites). Eeldati, et ebaõnnestumisest teatamine põhjustab lapse enesehinnangus mõningast ebapiisavust. Kontrollitud hüpotees (tasemel α = 0,005) oli, et enesehinnangute populatsiooni dispersioon ei sõltu edu või ebaõnnestumise aruannetest (Н 0: σ 1 2=σ 2 2).

Said järgmised andmed:


Samm 1. Arvutage valemite (4) abil kriteeriumi empiiriline väärtus ja vabadusastmete arv:

Etapp 2. Vastavalt f-Fisheri kriteeriumi kriitiliste väärtuste tabelile mittesuunatud alternatiivid, mille jaoks leiame kriitilise väärtuse df number = 11; df märk= 11. Kriitiline väärtus on aga ainult jaoks df number= 10 ja df märk = 12. Suuremat arvu vabadusastmeid ei saa võtta, seetõttu võtame kriitilise väärtuse jaoks df number= 10: jaoks R = 0,05 F Kp = 3,526; jaoks R = 0,01 F Kp = 5,418.

3. samm. Statistilise otsuse tegemine ja sisukas järeldus. Kuna empiiriline väärtus ületab kriitilist väärtust R= 0,01 (ja veelgi enam p = 0,05), siis antud juhul p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Järelikult on pärast ebaõnnestumisest teatamist enesehinnangu ebapiisavus kõrgem kui pärast edust teatamist.

/ praktiline statistika / teatmematerjalid / õpilaste t-testi väärtused

Tähendust - õpilase test olulisuse tasemel 0,10, 0,05 ja 0,01

ν – variatsioonivabaduse astmed

Studenti t-testi standardväärtused

Vabadusastmete arv

Olulisuse tasemed

Vabadusastmete arv

Olulisuse tasemed

Tabel XI

Fisheri testi standardväärtused, mida kasutatakse kahe proovi vaheliste erinevuste olulisuse hindamiseks

Vabaduse astmed

Olulisuse tase

Vabaduse astmed

Olulisuse tase

Üliõpilase t-test

Üliõpilase t-test- Studenti jaotuse alusel hüpoteeside statistilise kontrollimise meetodite klassi üldnimetus (statistilised testid). Levinumad t-testi rakendamise juhud on seotud kahe valimi keskmiste võrdsuse kontrollimisega.

t-statistika koostatakse tavaliselt järgmise üldpõhimõtte järgi: lugeja on juhuslik muutuja, mille matemaatiline ootus on null (kui nullhüpotees on täidetud), ja nimetaja on selle juhusliku suuruse valimi standardhälve, mis saadakse juhusliku suuruse ruutjuurena. segamata dispersiooni hinnang.

Lugu

Selle kriteeriumi töötas välja William Gosset, et hinnata Guinnessi õlle kvaliteeti. Seoses kohustustega ettevõtte ees ärisaladuste mitteavaldamise eest (Guinnessi juhtkond kaalus statistikaaparaadi sellist kasutamist oma töös) avaldati Gosseti artikkel 1908. aastal ajakirjas Biometrics pseudonüümi "Student" (Õpilane) all. .

Andmenõuded

Selle kriteeriumi rakendamiseks on vajalik, et algandmetel oleks normaaljaotus. Sõltumatutele valimitele kahevalimilise testi rakendamisel tuleb järgida ka dispersioonide võrdsuse tingimust. Ebavõrdsete dispersioonidega olukordade jaoks on Studenti t-testile siiski alternatiive.

Nõue, et andmete jaotus oleks normaalne, on vajalik täpse t (\displaystyle t) -testi jaoks. Kuid isegi muude andmejaotuste puhul on võimalik kasutada t (\displaystyle t) -statistikat. Paljudel juhtudel on sellel statistikal asümptootiliselt standardne normaaljaotus - N (0 , 1) (\displaystyle N(0,1)) , seega saab kasutada selle jaotuse kvantiile. Kuid sageli ka sel juhul ei kasutata kvantiile mitte standardsest normaaljaotusest, vaid vastavast Studenti jaotusest, nagu täpselt t (\displaystyle t) -testis. Need on asümptootiliselt samaväärsed, kuid väikeste valimite puhul on Studenti jaotuse usaldusvahemikud laiemad ja usaldusväärsemad.

Ühe valimi t-test

Seda kasutatakse nullhüpoteesi H 0 testimiseks: E (X) = m (\displaystyle H_(0):E(X)=m) ootuse E (X) võrdsuse kohta (\displaystyle E(X)) mõnele teadaolevale väärtusele m ( \displaystyle m) .

Ilmselgelt nullhüpoteesi korral E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Arvestades vaatluste oletatavat sõltumatust, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Kasutades erapooletu dispersioonihinnangut s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) saame järgmise t-statistika:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Nullhüpoteesi kohaselt on selle statistika jaotus t (n − 1) (\displaystyle t(n-1)) . Seega, kui statistika väärtus absoluutväärtuses ületab selle jaotuse kriitilist väärtust (antud olulisuse tasemel), lükatakse nullhüpotees tagasi.

Kahe valimiga t-test sõltumatute valimite jaoks

Olgu kaks sõltumatut valimit suurusega n 1 , n 2 (\displaystyle n_(1)~,~n_(2)) normaaljaotusega juhuslikest muutujatest X 1 , X 2 (\displaystyle X_(1),~X_(2 )) . Nende juhuslike suuruste matemaatiliste ootuste võrdsuse nullhüpoteesi H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) on vaja testida näidisandmete abil.

Vaatleme valimi keskmiste erinevust Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Ilmselgelt, kui nullhüpotees on täidetud, E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Selle erinevuse dispersioon põhineb valimite sõltumatusel: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1)) ^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Seejärel kasutades erapooletu dispersioonihinnangut s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) saame valimi keskmiste erinevuse dispersiooni erapooletu hinnangu: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^ (2))(n_(2) ))) . Seetõttu on nullhüpoteesi testimise t-statistika

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2)))) ))

Sellel statistikal on nullhüpoteesi kohaselt jaotus t (d f) (\displaystyle t(df)) , kus d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1 ) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1))) s_(2)^(2)/n_(2)^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+( s_(2)^(2)/n_(2)^(2)/(n_(2)-1))))

Sama dispersiooni juhtum

Kui eeldatakse, et valimi dispersioonid on samad, siis

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ murd (1) (n_ (2)))\parem))

Siis on t-statistika järgmine:

T = X ¯ 1 - X 2 s X 1 n 1 + 1 n 2, s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ kuvastiil t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ (2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Sellel statistikal on jaotus t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Kahe valimiga t-test sõltuvate valimite jaoks

Kriteeriumi t (\displaystyle t) empiirilise väärtuse arvutamiseks olukorras, kus testitakse hüpoteesi kahe sõltuva valimi (näiteks sama testi kaks valimit ajaintervalliga) erinevuste kohta, kasutatakse järgmist valemit :

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

kus M d (\displaystyle M_(d)) on väärtuste keskmine erinevus, s d (\displaystyle s_(d)) on erinevuste standardhälve ja n on vaatluste arv

Selle statistika jaotus on t (n − 1) (\displaystyle t(n-1)) .

Lineaarse regressiooni parameetrite lineaarse piirangu testimine

t-testiga saab testida ka tavaliste vähimruutudega hinnatud lineaarse regressiooni parameetrite suvalist (ühekordset) lineaarset piirangut. Olgu vaja testida hüpoteesi H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Ilmselgelt nullhüpoteesi korral E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)=c^( T)E((\kübar (b)))-a=0) . Siin kasutame mudeli parameetrite erapooletu vähimruutude hinnangute omadust E (b ^) = b (\displaystyle E((\hat (b)))=b) . Lisaks V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b)))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Kasutades tundmatu dispersiooni asemel selle erapooletut hinnangut s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)), saame järgmise t-statistika:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b)))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c))))

Selle statistika nullhüpoteesi kohaselt on jaotus t (n − k) (\displaystyle t(n-k)) , seega kui statistika väärtus on suurem kui kriitiline väärtus, siis on lineaarse piirangu nullhüpotees tagasi lükatud.

Lineaarse regressioonikordaja hüpoteeside kontrollimine

Lineaarse piirangu erijuhtum on testida hüpoteesi, et regressioonikordaja b j (\displaystyle b_(j)) on võrdne mingi väärtusega a (\displaystyle a) . Sel juhul on vastav t-statistika:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

kus s b ^ j (\displaystyle s_((\hat (b))_(j))) on koefitsiendi hinnangu standardviga - koefitsientide hinnangute kovariatsioonimaatriksi vastava diagonaalelemendi ruutjuur.

Nullhüpoteesi kohaselt on selle statistika jaotus t (n − k) (\displaystyle t(n-k)) . Kui statistika absoluutväärtus on suurem kui kriitiline väärtus, siis on koefitsiendi erinevus a-st (\displaystyle a) statistiliselt oluline (mittejuhuslik), vastasel juhul on see ebaoluline (juhuslik, st tõene koefitsient on tõenäoliselt võrdne eeldatava väärtusega (\ kuvastiil a) või sellele väga lähedal.

Kommenteeri

Matemaatiliste ootuste ühe valimi testi saab taandada lineaarse regressiooni parameetrite lineaarse piirangu testimiseks. Ühe valimiga testis on see konstandi "regressioon". Seetõttu on regressiooni s 2 (\displaystyle s^(2)) uuritava juhusliku suuruse dispersiooni valimihinnang, maatriks X T X (\displaystyle X^(T)X) on n (\displaystyle n) , ja mudeli “koefitsiendi” hinnang on valimi keskmine. Sellest saame ülaltoodud üldjuhtumi t-statistika avaldise.

Samamoodi saab näidata, et kahe valimiga test võrdsete valimite dispersioonidega taandub samuti lineaarsete piirangute testimiseks. Kahe valimiga testis on see "regressioon" konstandile ja näivmuutujale, mis identifitseerib alamvalimi sõltuvalt väärtusest (0 või 1): y = a + b D (\displaystyle y=a+bD) . Hüpoteesi valimite matemaatiliste ootuste võrdsuse kohta saab sõnastada hüpoteesina selle mudeli koefitsiendi b võrdsusest nulliga. Võib näidata, et vastav t-statistika selle hüpoteesi kontrollimiseks on võrdne kahevalimilise testi jaoks antud t-statistikaga.

Seda saab taandada ka lineaarse piirangu kontrollimiseks erinevate dispersioonide korral. Sel juhul võtab mudeli vigade dispersioon kaks väärtust. Sellest võib saada ka kahevalimilise testi jaoks antud t-statistika.

Mitteparameetrilised analoogid

Sõltumatute proovide kahe valimiga testi analoog on Mann-Whitney U-test. Sõltuvate valimitega olukorra puhul on analoogideks märgitest ja Wilcoxoni T-test

Kirjandus

õpilane. Keskmise tõenäoline viga. // Biomeetria. 1908. nr 6 (1). Lk 1-25.

Lingid

Vahendite homogeensuse hüpoteeside kontrollimise kriteeriumide kohta Novosibirski Riikliku Tehnikaülikooli veebisaidil

Studenti t-test on Studenti jaotusel põhinevate hüpoteeside statistilise kontrollimise meetodite klassi üldnimetus (statistilised testid). Levinumad t-testi rakendamise juhud on seotud kahe valimi keskmiste võrdsuse kontrollimisega.

1. T-testi kujunemislugu

See kriteerium töötati välja William Gosset hinnata õlle kvaliteeti Guinnessis. Seoses kohustustega ettevõtte ees ärisaladusi mitte avaldada, avaldati Gosseti artikkel 1908. aastal ajakirjas Biometrics pseudonüümi "Õpilane" (Student) all.

2. Milleks Studenti t-testi kasutatakse?

Keskmiste erinevuste statistilise olulisuse määramiseks kasutatakse Studenti t-testi. Seda saab kasutada nii sõltumatute valimite võrdlemisel ( näiteks suhkurtõvega patsientide rühmad ja tervete patsientide rühmad) ja seotud komplektide võrdlemisel ( nt keskmine südame löögisagedus samadel patsientidel enne ja pärast antiarütmilise ravimi võtmist).

3. Millal saab Studenti t-testi kasutada?

Studenti t-testi rakendamiseks on vajalik algandmete olemasolu normaaljaotus. Sõltumatute valimite kahevalimilise testi rakendamisel on vaja täita ka tingimus dispersioonide võrdsus (homoskedastilisus)..

Kui need tingimused ei ole täidetud, tuleks valimi keskmiste võrdlemisel kasutada sarnaseid meetodeid. mitteparameetriline statistika, mille hulgas on kõige kuulsamad Mann-Whitney U-test (kahe valimi katsena sõltumatute valimite jaoks) ja märgi kriteerium ja Wilcoxoni test(kasutatakse sõltuvate valimite puhul).

4. Kuidas arvutada Studenti t-testi?

Keskmiste võrdlemiseks arvutatakse Studenti t-test järgmise valemi abil:

kus M 1- esimese võrreldud populatsiooni (rühma) aritmeetiline keskmine, M 2- teise võrreldava populatsiooni (rühma) aritmeetiline keskmine, m 1- esimese aritmeetilise keskmise keskmine viga, m2- teise aritmeetilise keskmise keskmine viga.

5. Kuidas tõlgendada Studenti t-testi väärtust?

Studenti t-testi saadud väärtust tuleb õigesti tõlgendada. Selleks peame teadma ainete arvu igas rühmas (n 1 ja n 2). Vabadusastmete arvu leidmine f järgmise valemi järgi:

f \u003d (n 1 + n 2) - 2

Pärast seda määrame Studenti t-testi kriitilise väärtuse vajaliku olulisuse taseme (näiteks p=0,05) ja etteantud arvu vabadusastmete jaoks. f tabeli järgi ( vaata allpool).

Võrdleme kriteeriumi kriitilisi ja arvutatud väärtusi:

  • Kui Studenti t-testi arvutatud väärtus võrdne või suurem Kriitiline, leiti tabelist, järeldame, et erinevused võrreldavate väärtuste vahel on statistiliselt olulised.
  • Kui arvutatud Studenti t-testi väärtus vähem tabelina, mis tähendab, et erinevused võrreldavate väärtuste vahel ei ole statistiliselt olulised.

6. Studenti t-testi arvutamise näide

Uue rauapreparaadi efektiivsuse uurimiseks valiti välja kaks aneemiaga patsientide rühma. Esimeses rühmas said patsiendid kaks nädalat uut ravimit ja teises rühmas platseebot. Pärast seda mõõdeti hemoglobiini taset perifeerses veres. Esimeses rühmas oli keskmine hemoglobiini tase 115,4±1,2 g/l ja teises - 103,7±2,3 g/l (andmed on esitatud kujul M±m), on võrreldavatel populatsioonidel normaalne jaotus. Esimeses rühmas oli 34 ja teises 40 patsienti. Tuleb teha järeldus saadud erinevuste statistilise olulisuse ja uue rauapreparaadi efektiivsuse kohta.

Lahendus: Erinevuste olulisuse hindamiseks kasutame Studenti t-testi, mis arvutatakse keskmiste erinevusena, mis on jagatud vigade ruudu summaga:

Pärast arvutuste tegemist võrdus t-testi väärtus 4,51-ga. Leiame vabadusastmete arvu (34 + 40) - 2 = 72. Saadud Studenti t-testi väärtust 4,51 võrdleme tabelis näidatud kriitilise väärtusega p=0,05: 1,993. Kuna kriteeriumi arvutuslik väärtus on suurem kui kriitiline väärtus, järeldame, et täheldatud erinevused on statistiliselt olulised (olulisuse tase p<0,05).

Üks tuntumaid statistilisi tööriistu on Studenti t-test. Seda kasutatakse erinevate paaride kaupa suuruste statistilise olulisuse mõõtmiseks. Microsoft Excelil on selle indikaatori arvutamiseks spetsiaalne funktsioon. Õpime arvutama Studenti t-testi Excelis.

Alustuseks uurime siiski, mis on Üliõpilase kriteerium üldiselt. Seda indikaatorit kasutatakse kahe proovi keskmiste väärtuste võrdsuse kontrollimiseks. See tähendab, et see määrab kahe andmerühma erinevuste kehtivuse. Samal ajal kasutatakse selle kriteeriumi määramiseks tervet meetodite komplekti. Näitajat saab arvutada ühe- või kahesabalise jaotusega.

Näitaja arvutamine Excelis

Liigume nüüd edasi küsimuse juurde, kuidas seda indikaatorit Excelis arvutada. Seda saab teha funktsiooni kaudu ÕPILASTE TEST. Excel 2007 ja varasemates versioonides nimetati seda TEST. Hilisematesse versioonidesse jäeti see aga ühilduvuse huvides, kuid nendes on siiski soovitatav kasutada moodsamat - ÕPILASTE TEST. Seda funktsiooni saab kasutada kolmel viisil, mida arutatakse üksikasjalikult allpool.

1. meetod: funktsiooniviisard

Lihtsaim viis selle indikaatori arvutamiseks on funktsiooniviisardi kaudu.


Arvutamine tehakse ja tulemus kuvatakse ekraanil eelvalitud lahtris.

2. meetod: vahekaardi Valemid kasutamine

Funktsioon ÕPILASTE TEST saab helistada ka vahekaardile minnes "Valemid" kasutades spetsiaalset nuppu lindil.


3. meetod: käsitsi sisestamine

Valem ÕPILASTE TEST selle saab ka käsitsi sisestada töölehe mis tahes lahtrisse või funktsiooniribale. Selle süntaks näeb välja selline:

STUDENT.TEST(massiivi1,massiivi2,sabad,tüüp)

Esimese meetodi analüüsimisel võeti arvesse, mida iga argument tähendab. Need väärtused tuleks selle funktsiooniga asendada.

Pärast andmete sisestamist vajutage nuppu Sisenema tulemuse kuvamiseks ekraanil.

Nagu näete, arvutatakse Õpilase kriteerium Excelis väga lihtsalt ja kiiresti. Peaasi, et arvutusi tegev kasutaja peab aru saama, mis ta on ja millised sisendandmed mille eest vastutavad. Programm teostab otsearvutuse ise.

Seotud väljaanded