Usaldusintervallid. Usaldusvahemik

"Katren-Style" jätkab Konstantin Kravchiku meditsiinistatistika tsükli väljaandmist. Kahes varasemas artiklis käsitles autor selliste mõistete nagu ja selgitusi.

Konstantin Kravtšik

Matemaatik-analüütik. Meditsiini ja humanitaarteaduste statistiliste uuringute valdkonna spetsialist

Moskva linn

Väga sageli võite kliinilisi uuringuid käsitlevatest artiklitest leida salapärase fraasi: "usaldusvahemik" (95% CI või 95% CI - usaldusvahemik). Näiteks võib artikkel öelda: "Erinevuste olulisuse hindamiseks kasutati õpilase t-testi, arvutati 95% usaldusvahemik."

Mis on "95% usaldusvahemiku" väärtus ja miks seda arvutada?

Mis on usaldusvahemik? - See on vahemik, kuhu populatsiooni tegelikud keskmised väärtused langevad. Ja mis, on "valed" keskmised? Mõnes mõttes jah. Aastal selgitasime, et huvipakkuvat parameetrit on võimatu mõõta kogu populatsioonis, seega on teadlased rahul piiratud valimiga. Selles valimis (näiteks kehakaalu järgi) on üks keskmine väärtus (teatud kaal), mille järgi hindame keskmist väärtust kogu üldpopulatsioonis. Siiski on ebatõenäoline, et keskmine kaal valimis (eriti väikeses) langeb kokku üldkogumi keskmise kaaluga. Seetõttu on õigem arvutada ja kasutada üldpopulatsiooni keskmiste väärtuste vahemikku.

Oletame näiteks, et hemoglobiini 95% usaldusvahemik (95% usaldusvahemik) on vahemikus 110–122 g/l. See tähendab, et 95% tõenäosusega on hemoglobiini tegelik keskmine väärtus üldpopulatsioonis vahemikus 110–122 g/l. Teisisõnu, me ei tea keskmist hemoglobiini üldpopulatsioonis, kuid võime näidata selle funktsiooni väärtuste vahemikku 95% tõenäosusega.

Usaldusvahemikud on eriti olulised rühmade vaheliste keskmiste erinevuste või nn efekti suuruse jaoks.

Oletame, et võrdlesime kahe rauapreparaadi efektiivsust: ühe, mis on olnud turul pikka aega ja seda, mis on äsja registreeritud. Pärast ravikuuri hinnati hemoglobiini kontsentratsiooni uuritud patsiendirühmades ja statistiline programm arvutas meie jaoks välja, et kahe rühma keskmiste väärtuste erinevus tõenäosusega 95% on vahemikus 1,72 kuni 14,36 g/l (tabel 1).

Tab. 1. Sõltumatute valimite kriteerium
(rühmi võrreldakse hemoglobiini taseme järgi)

Seda tuleks tõlgendada järgmiselt: osal patsientidest, kes võtavad uut ravimit, on hemoglobiin keskmiselt 1,72–14,36 g/l kõrgem kui neil, kes võtsid juba tuntud ravimit.

Teisisõnu, üldpopulatsioonis on hemoglobiini keskmiste väärtuste erinevus rühmades 95% tõenäosusega nendes piirides. Seda, kas seda on palju või vähe, otsustab uurija. Selle kõige mõte seisneb selles, et me ei tööta ühe keskmise väärtusega, vaid väärtuste vahemikuga, seetõttu hindame usaldusväärsemalt parameetrite erinevust rühmade vahel.

Statistikapakettides saab teadlase äranägemisel usaldusvahemiku piire iseseisvalt kitsendada või laiendada. Usaldusvahemiku tõenäosusi vähendades ahendame keskmiste vahemikku. Näiteks 90% CI puhul on keskmiste vahemik (või keskmised erinevused) kitsam kui 95% CI juures.

Vastupidi, tõenäosuse suurendamine 99%-ni avardab väärtuste vahemikku. Rühmade võrdlemisel võib CI alumine piir ületada nullmärgi. Näiteks kui pikendasime usaldusvahemiku piire 99 %-ni, siis jäid intervalli piirid vahemikku –1 kuni 16 g/L. See tähendab, et üldpopulatsioonis on rühmi, mille keskmiste erinevus uuritava tunnuse puhul on 0 (M=0).

Usaldusvahemikke saab kasutada statistiliste hüpoteeside kontrollimiseks. Kui usaldusvahemik ületab nullväärtust, siis nullhüpotees, mis eeldab, et rühmad ei erine uuritava parameetri poolest, on tõene. Eespool on kirjeldatud näide, kui laiendasime piire 99% -ni. Kuskilt üldpopulatsioonist leidsime rühmi, mis ei erinenud millegi poolest.

95% hemoglobiini erinevuse usaldusvahemik (g/l)


Joonisel on joonena näidatud kahe rühma keskmise hemoglobiini erinevuse 95% usaldusvahemik. Joon läbib nullmärgi, seetõttu on nulliga võrdsete keskmiste vahel erinevus, mis kinnitab nullhüpoteesi, et rühmad ei erine. Erinevus rühmade vahel jääb vahemikku -2 kuni 5 g/l, mis tähendab, et hemoglobiin võib kas langeda 2 g/l või tõusta 5 g/l võrra.

Usaldusvahemik on väga oluline näitaja. Tänu sellele on näha, kas erinevused rühmades olid tõesti tingitud keskmiste erinevusest või suurest valimist, sest suure valimi puhul on erinevuste leidmise võimalus suurem kui väikese valimi puhul.

Praktikas võib see välja näha selline. Võtsime 1000 inimesest koosneva proovi, mõõtsime hemoglobiinitaset ja leidsime, et keskmiste erinevuse usaldusvahemik on 1,2–1,5 g/l. Statistilise olulisuse tase antud juhul lk

Näeme, et hemoglobiini kontsentratsioon tõusis, kuid peaaegu märkamatult, seetõttu ilmnes statistiline olulisus just tänu valimi suurusele.

Usaldusvahemikke saab arvutada mitte ainult keskmiste, vaid ka proportsioonide (ja riskisuhete) jaoks. Näiteks huvitab meid väljatöötatud ravimi võtmise ajal remissiooni saavutanud patsientide osakaalu usaldusvahemik. Oletame, et proportsioonide, st selliste patsientide osakaalu 95% CI on vahemikus 0,60–0,80. Seega võime öelda, et meie ravimil on terapeutiline toime 60–80% juhtudest.

Usaldusvahemik

Usaldusvahemik- matemaatilises statistikas kasutatav termin statistiliste parameetrite intervallhinnanguks (erinevalt punkthinnangust), mis on eelistatav väikese valimi korral. Usaldusvahemik on intervall, mis katab teadmata parameetri antud usaldusväärsusega.

Usaldusvahemike meetodi töötas välja Ameerika statistik Jerzy Neumann, tuginedes inglise statistiku Ronald Fischeri ideedele.

Definitsioon

Usaldusvahemiku parameeter θ juhusliku muutuja jaotus X usaldustasemega 100 p%, genereeritud proovi ( x 1 ,…,x n), nimetatakse intervalliks piiridega ( x 1 ,…,x n) ja ( x 1 ,…,x n) mis on juhuslike suuruste realisatsioonid L(X 1 ,…,X n) ja U(X 1 ,…,X n) selline

.

Usaldusvahemiku piiripunkte nimetatakse usalduspiirid.

Usaldusvahemiku intuitsioonipõhine tõlgendus oleks: kui lk on suur (näiteks 0,95 või 0,99), siis sisaldab usaldusvahemik peaaegu kindlasti tõelist väärtust θ .

Usaldusvahemiku mõiste teine ​​tõlgendus: seda võib pidada parameetri väärtuste intervalliks θ ühilduvad eksperimentaalsete andmetega ega ole nendega vastuolus.

Näited

  • Normaalvalimi matemaatilise ootuse usaldusvahemik ;
  • Valimi normaalse dispersiooni usaldusvahemik .

Bayesi usaldusintervall

Bayesi statistikas on usaldusvahemiku määratlus, mis on sarnane, kuid erineb mõne põhidetailide poolest. Siin peetakse hinnangulist parameetrit ennast juhuslikuks muutujaks, millel on teatud a priori jaotus (lihtsamal juhul ühtlane) ja valim on fikseeritud (klassikalises statistikas on kõik täpselt vastupidine). Bayesi usaldusvahemik on intervall, mis katab parameetri väärtuse posterioorse tõenäosusega:

.

Üldiselt on klassikalised ja Bayesi usaldusvahemikud erinevad. Ingliskeelses kirjanduses nimetatakse Bayesi usaldusvahemikku tavaliselt terminiks usutav intervall, ja klassika usaldusvahemik.

Märkmed

Allikad

Wikimedia sihtasutus. 2010 .

  • Beebi (film)
  • Kolonist

Vaadake, mis on "usaldusintervall" teistes sõnaraamatutes:

    Usaldusvahemik- valimiandmetest arvutatud intervall, mis etteantud tõenäosusega (usaldusega) katab hinnangulise jaotusparameetri teadmata tõeväärtuse. Allikas: GOST 20522 96: Mullad. Tulemuste statistilise töötlemise meetodid ... Normatiivse ja tehnilise dokumentatsiooni terminite sõnastik-teatmik

    usaldusvahemik- üldkogumi skalaarparameetri puhul on see segment, mis seda parameetrit suure tõenäosusega sisaldab. See fraas on ilma täiendava selgituseta mõttetu. Kuna usaldusvahemiku piire hinnatakse valimi põhjal, on loomulik, et ... ... Sotsioloogilise statistika sõnastik

    USALDUSVAHEMIK on parameetrite hindamise meetod, mis erineb punkthinnangust. Olgu antud näidis x1, . . ., xn jaotusest, mille tõenäosustihedus on f(x, α) ja a*=a*(x1, . . ., xn) on hinnang α, g(a*, α) on jaotuse tõenäosustihedus. hinnang. Otsivad…… Geoloogiline entsüklopeedia

    USALDUSVAHEMIK- (usaldusvahemik) Intervall, mille puhul valikuuringust tuletatud üldkogumi parameetri väärtuse usaldusväärsus on valimi enda tõttu teatud tõenäosusega, näiteks 95%. Laius…… Majandussõnastik

    usaldusvahemik- on intervall, milles määratud suuruse tegelik väärtus paikneb antud usaldustõenäosusega. Üldine keemia: õpik / A. V. Zholnin ... Keemilised terminid

    Usaldusvahemik CI- Usaldusvahemik, CI * davyaralny intervall, CI * usaldusintervall märgi väärtuse, arvutatud c.l. jaotusparameeter (nt tunnuse keskmine väärtus) üle valimi ja teatud tõenäosusega (nt 95% puhul 95% ... Geneetika. entsüklopeediline sõnaraamat

    USALDUSVAHEMIK- mõiste, mis tekib parameetri statistika hindamisel. jaotus väärtuste intervalli järgi. D. i. antud koefitsiendile vastava parameetri q jaoks. usaldus P, on võrdne sellise intervalliga (q1, q2), et mis tahes ebavõrdsuse tõenäosuse jaotuse korral ... ... Füüsiline entsüklopeedia

    usaldusvahemik- - Telekommunikatsiooni teemad, põhimõisted EN usaldusvahemik ... Tehnilise tõlkija käsiraamat

    usaldusvahemik- pasikliovimo intervalas statusas T valdkond Standartiseerimine ir metroloogia apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. vastavusmenys: engl. usaldusvahemik vok. Vertrauensbereich, m rus.… … Penkiakalbis aiskinamasis metrologijos terminų žodynas

    usaldusvahemik- pasikliovimo intervalas statusas T valdkond chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. vastavusmenys: engl. usaldusvahemik rus. usaldusala; usaldusvahemik... Chemijos terminų aiskinamasis žodynas

Eelmistes alajaotistes käsitlesime tundmatu parameetri hindamise küsimust aüks number. Sellist hinnangut nimetatakse "punktiks". Paljude ülesannete puhul pole vaja ainult parameetrit leida a sobiv arvväärtus, vaid hinnake ka selle täpsust ja usaldusväärsust. On vaja teada, milliseid vigu parameetrite asendamine kaasa tuua võib a selle punkthinnang a ja kui suure kindlusega võime eeldada, et need vead ei ületa teadaolevaid piire?

Sedalaadi probleemid on eriti olulised väikese arvu vaatluste puhul, kui punkthinnang ja sisse on suures osas juhuslik ja a ligikaudne asendamine a-ga võib põhjustada tõsiseid vigu.

Anda aimu hinnangu täpsusest ja usaldusväärsusest a,

matemaatilises statistikas kasutatakse nn usaldusvahemikke ja usaldustõenäosusi.

Laske parameetri jaoks a saadud kogemusest erapooletu hinnanguga a. Tahame antud juhul hinnata võimalikku viga. Määrakem mingi piisavalt suur tõenäosus p (näiteks p = 0,9, 0,95 või 0,99), et sündmust tõenäosusega p saaks pidada praktiliselt kindlaks, ja leiame s väärtuse, mille korral

Seejärel asendamisel ilmneva vea praktiliselt võimalike väärtuste vahemik a peal a, on ± s; suured absoluutvead ilmnevad ainult väikese tõenäosusega a = 1 - p. Kirjutame (14.3.1) ümber järgmiselt:

Võrdsus (14.3.2) tähendab, et tõenäosusega p on parameetri tundmatu väärtus a jääb intervalli sisse

Sel juhul tuleb märkida üks asjaolu. Varem kaalusime korduvalt tõenäosust, et juhuslik suurus langeb antud mittejuhuslikku intervalli. Siin on olukord erinev: a mitte juhuslik, vaid juhuslik intervall / r. Juhuslikult selle asukoht x-teljel, mille määrab selle keskpunkt a; üldiselt on ka intervalli 2s pikkus juhuslik, kuna s väärtus arvutatakse reeglina katseandmete põhjal. Seetõttu oleks sel juhul parem tõlgendada p väärtust mitte kui tõenäosust "punkti tabada" a intervalli / p, vaid tõenäosusena, et juhuslik intervall / p katab punkti a(joonis 14.3.1).

Riis. 14.3.1

Tõenäosust p nimetatakse usalduse tase ja intervall / p - usaldusvahemik. Intervallide piirid kui. a x \u003d a- s ja a 2 = a + ja neid kutsutakse usalduse piirid.

Andkem usaldusintervalli mõistele veel üks tõlgendus: seda võib pidada parameetri väärtuste intervalliks a,ühilduvad eksperimentaalsete andmetega ega ole nendega vastuolus. Tõepoolest, kui nõustume pidama sündmust tõenäosusega a = 1-p praktiliselt võimatuks, siis on need parameetri a väärtused, mille puhul a - a> s tuleb tunnistada katseandmetega vastuolus olevaks ja need, mille puhul |a - a a t na 2 .

Laske parameetri jaoks a on erapooletu hinnang a. Kui me teaksime suuruse jaotuse seadust a, oleks usaldusvahemiku leidmise probleem üsna lihtne: piisaks s väärtuse leidmisest, mille jaoks

Raskus seisneb selles, et hinnangu jaotusseadus a sõltub koguse jaotuse seadusest X ja järelikult ka selle tundmatutel parameetritel (eriti parameetril endal a).

Sellest raskusest ülesaamiseks saab rakendada järgmist ligikaudset nippi: asendada avaldises olevad tundmatud parameetrid nende punkthinnangutega. Suhteliselt suure hulga katsetega P(umbes 20 ... 30) annab see tehnika tavaliselt täpsuse osas rahuldavaid tulemusi.

Vaatleme näiteks matemaatilise ootuse usaldusvahemiku probleemi.

Lase toota P x, mille tunnusteks on matemaatiline ootus t ja dispersioon D- teadmata. Nende parameetrite kohta saadi järgmised hinnangud:

Matemaatilise ootuse jaoks on vaja koostada usaldusvahemik / р, mis vastab usaldustõenäosusele р t kogused x.

Selle probleemi lahendamisel kasutame asjaolu, et kogus t on summa P sõltumatud identselt jaotatud juhuslikud muutujad X h ja keskpiiri teoreemi järgi piisavalt suureks P selle jaotusseadus on normilähedane. Praktikas võib isegi suhteliselt väikese liikmete arvuga (suurusjärgus 10 ... 20) summa jaotusseadust pidada ligikaudu normaalseks. Eeldame, et väärtus t jaotatakse tavaseaduse järgi. Selle seaduse tunnused – matemaatiline ootus ja dispersioon – on vastavalt võrdsed t ja

(vt ptk 13 alajaotis 13.3). Oletame, et väärtus D on meile teada ja leiame sellise väärtuse Ep mille jaoks

Rakendades 6. peatüki valemit (6.3.5), väljendame tõenäosuse (14.3.5) vasakul küljel normaaljaotuse funktsioonina

kus on hinnangu standardhälve t.

Võrrandist

leidke Sp väärtus:

kus arg Ф* (x) on Ф* pöördfunktsioon (X), need. argumendi selline väärtus, mille normaaljaotuse funktsioon on võrdne X.

Dispersioon D, mille kaudu väärtust väljendatakse a 1P, me ei tea täpselt; selle ligikaudse väärtusena võite kasutada hinnangut D(14.3.4) ja pange ligikaudu:

Seega on usaldusvahemiku konstrueerimise probleem ligikaudu lahendatud, mis on võrdne:

kus gp on defineeritud valemiga (14.3.7).

Pöördinterpolatsiooni vältimiseks funktsiooni Ф * (l) tabelites s p arvutamisel on mugav koostada spetsiaalne tabel (tabel 14.3.1), kus on loetletud suuruse väärtused.

olenevalt r-st. Väärtus (p määrab normaalseaduse jaoks standardhälbete arvu, mis tuleb dispersioonikeskmest paremale ja vasakule jätta kõrvale, et saadavasse piirkonda langemise tõenäosus oleks võrdne p-ga.

Väärtuse 7 p kaudu väljendatakse usaldusvahemikku järgmiselt:

Tabel 14.3.1

Näide 1. Väärtusega viidi läbi 20 katset x; tulemused on toodud tabelis. 14.3.2.

Tabel 14.3.2

On vaja leida kvantiteedi matemaatilise ootuse hinnang X ja konstrueerida usaldusvahemik, mis vastab usaldustasemele p = 0,8.

Lahendus. Meil on:

Valides lähtepunktiks n: = 10, leiame kolmanda valemi (14.2.14) järgi erapooletu hinnangu D :

Tabeli järgi 14.3.1 leiame

Usalduse piirid:

Usaldusvahemik:

Parameetrite väärtused t, selles intervallis asuvad andmed ühilduvad tabelis toodud katseandmetega. 14.3.2.

Sarnasel viisil saab dispersiooni jaoks konstrueerida usaldusvahemiku.

Lase toota P sõltumatud katsed juhusliku muutujaga X tundmatute parameetritega alates ja A ning dispersiooni jaoks D erapooletu hinnang saadakse:

Dispersioonile tuleb ligikaudselt luua usaldusvahemik.

Valemist (14.3.11) on näha, et väärtus D esindab

summa P juhuslikud muutujad kujul . Need väärtused ei ole

sõltumatu, kuna ükskõik milline neist sisaldab kogust t, sõltuvad kõigist teistest. Siiski saab näidata, et nagu P ka nende summa jaotusseadus on normaallähedane. Peaaegu kell P= 20...30 võib seda juba normaalseks pidada.

Oletame, et see on nii, ja leiame selle seaduse tunnused: matemaatiline ootus ja dispersioon. Alates skoori D- siis erapooletu M[D] = D.

Dispersiooni arvutamine D D on seotud suhteliselt keerukate arvutustega, seega anname selle avaldise ilma tuletamiseta:

kus c 4 - suuruse neljas keskmoment x.

Selle avaldise kasutamiseks peate selles asendama väärtused 4 ja D(vähemalt ligikaudne). Selle asemel D saate hindamist kasutada D. Põhimõtteliselt saab neljanda keskmomendi asendada ka selle hinnanguga, näiteks vormi väärtusega:

kuid selline asendamine annab äärmiselt madala täpsuse, kuna üldiselt määratakse piiratud arvu katsete korral kõrgetasemelised momendid suurte vigadega. Kuid praktikas juhtub sageli, et suuruse jaotusseaduse vorm X ette teada: teadmata on ainult selle parameetrid. Seejärel võime proovida u4-d väljendada D.

Võtame kõige tavalisema juhtumi, kui väärtus X jaotatakse tavaseaduse järgi. Seejärel väljendatakse selle neljandat keskmomenti dispersioonina (vt 6. peatüki alajaotis 6.2);

ja valem (14.3.12) annab või

Asendab (14.3.14) tundmatu D tema hinnang D, saame: kust

Momenti u 4 saab väljendada D ka mõnel muul juhul, kui koguse jaotamine X ei ole normaalne, kuid selle välimus on teada. Näiteks ühtlase tiheduse seaduse jaoks (vt 5. peatükk) on meil:

kus (a, P) on intervall, millel seadus on antud.

Järelikult

Valemi (14.3.12) järgi saame: kust leiame ligikaudu

Juhtudel, kui väärtuse 26 jaotusseaduse vorm on teadmata, on a /) väärtuse hindamisel siiski soovitatav kasutada valemit (14.3.16), kui pole erilist alust arvata, et see seadus on tavalisest väga erinev (on märgatav positiivne või negatiivne kurtoos) .

Kui a /) ligikaudne väärtus saadakse ühel või teisel viisil, siis on dispersioonile võimalik konstrueerida usaldusvahemik samamoodi nagu me selle matemaatilise ootuse jaoks koostasime:

kus antud tõenäosusest p sõltuv väärtus on leitud tabelist. 14.3.1.

Näide 2. Leidke juhusliku muutuja dispersiooni ligikaudu 80% usaldusvahemik X näite 1 tingimustel, kui on teada, et väärtus X jaotatakse normaalsele lähedase seaduse järgi.

Lahendus. Väärtus jääb samaks nagu tabelis. 14.3.1:

Vastavalt valemile (14.3.16)

Valemi (14.3.18) järgi leiame usaldusvahemiku:

Standardhälbe vastav väärtuste vahemik: (0,21; 0,29).

14.4. Täpsed meetodid normaalseaduse järgi jaotatud juhusliku suuruse parameetrite usaldusvahemike konstrueerimiseks

Eelmises alapeatükis käsitlesime ligikaudseid meetodeid keskmise ja dispersiooni usaldusvahemike koostamiseks. Siin anname ülevaate täpsetest meetoditest sama probleemi lahendamiseks. Rõhutame, et usaldusvahemike täpseks leidmiseks on tingimata vaja eelnevalt teada suuruse jaotusseaduse vormi x, arvestades, et see ei ole ligikaudsete meetodite rakendamiseks vajalik.

Usaldusvahemike konstrueerimise täpsete meetodite idee on järgmine. Mis tahes usaldusvahemik leitakse tingimusest, mis väljendab mõne ebavõrdsuse täitumise tõenäosust, mis sisaldab meile huvipakkuvat hinnangut a. Hinnete jaotamise seadus aüldiselt sõltub koguse tundmatutest parameetritest x. Mõnikord on aga võimalik juhuslikust suurusest ebavõrdsust sisse kanda a mõnele muule vaadeldavate väärtuste funktsioonile X p X 2, ..., X lk. mille jaotusseadus ei sõltu tundmatutest parameetritest, vaid sõltub ainult katsete arvust ja suuruse jaotusseaduse vormist x. Seda tüüpi juhuslikud muutujad mängivad matemaatilises statistikas suurt rolli; neid on kõige detailsemalt uuritud koguse normaaljaotuse korral x.

Näiteks on tõestatud, et koguse normaaljaotuse korral X juhuslik väärtus

alluvad nn Üliõpilaste jaotusseadus Koos P- 1 vabadusaste; selle seaduse tihedusel on vorm

kus G(x) on teadaolev gammafunktsioon:

Samuti on tõestatud, et juhuslik suurus

on "distribution % 2 " koos P- 1 vabadusaste (vt ptk 7), mille tihedust väljendatakse valemiga

Jaotuste (14.4.2) ja (14.4.4) tuletustel peatumata näitame, kuidas neid saab rakendada parameetrite usaldusvahemike koostamisel. Ty D.

Lase toota P sõltumatud katsed juhusliku muutujaga x, jaotatud tavaseaduse järgi tundmatute parameetritega TIO. Nende parameetrite puhul hinnangud

Mõlema parameetri jaoks on vaja konstrueerida usaldusvahemikud, mis vastavad usalduse tõenäosusele p.

Alustuseks koostame matemaatilise ootuse usaldusvahemiku. On loomulik, et see intervall on sümmeetriline t; tähistab s p-ga pool intervalli pikkust. Sp väärtus tuleb valida nii, et tingimus

Proovime juhuslikust suurusest võrdsuse (14.4.5) vasakut poolt edasi anda t juhuslikule suurusele T, levitatakse vastavalt Studenti seadusele. Selleks korrutame mõlemad võrratuse osad |m-w?|

positiivse väärtuseni: või kasutades tähist (14.4.1),

Leiame sellise arvu / p, et väärtuse / p on võimalik leida tingimusest

Valemist (14.4.2) on näha, et (1) on paarisfunktsioon, seega (14.4.8) annab

Võrdsus (14.4.9) määrab väärtuse / p sõltuvalt p-st. Kui teie käsutuses on integraalväärtuste tabel

siis saab väärtuse / p leida tabelist pöördinterpolatsiooni teel. Siiski on mugavam koostada väärtuste / p tabel eelnevalt. Selline tabel on toodud lisas (tabel 5). See tabel näitab väärtusi, mis sõltuvad usalduse tõenäosusest p ja vabadusastmete arvust P- 1. Olles määranud / p vastavalt tabelile. 5 ja eeldades

leiame pool usaldusvahemiku / p laiusest ja intervalli enda

Näide 1. Juhusliku muutujaga viidi läbi 5 sõltumatut katset x, tavaliselt jaotatud tundmatute parameetritega t ja umbes. Katsete tulemused on toodud tabelis. 14.4.1.

Tabel 14.4.1

Leidke hinnang t matemaatilise ootuse jaoks ja konstrueerige selle jaoks 90% usaldusvahemik / p (st intervall, mis vastab usalduse tõenäosusele p \u003d 0,9).

Lahendus. Meil on:

Taotluse tabeli 5 kohaselt P - 1 = 4 ja p = 0,9 leiame kus

Usaldusvahemik on

Näide 2. Alajaotise 14.3 näite 1 tingimuste jaoks, eeldades väärtust X normaalselt jaotatud, leidke täpne usaldusvahemik.

Lahendus. Taotluse tabeli 5 järgi leiame kl P - 1 = 19ir =

0,8 / p = 1,328; siit

Võrreldes alajao 14.3 näite 1 lahendusega (e p = 0,072), näeme, et lahknevus on väga väike. Kui jätta täpsus teise kümnendkohani, on täpse ja ligikaudse meetodiga leitud usaldusvahemikud samad:

Liigume edasi dispersiooni usaldusvahemiku konstrueerimise juurde. Võtke arvesse erapooletut dispersiooni hinnangut

ja väljendada juhuslikku suurust D väärtuse kaudu V(14.4.3) jaotusega x 2 (14.4.4):

Suuruse jaotusseaduse tundmine V, on võimalik leida intervall / (1 ), kuhu see etteantud tõenäosusega p langeb.

jaotusseadus k n _ x (v) I 7 väärtus on joonisel fig. 14.4.1.

Riis. 14.4.1

Tekib küsimus: kuidas valida intervalli / p? Kui suuruse jaotusseadus V oli sümmeetriline (nagu normaalseadus või Studenti jaotus), oleks loomulik võtta intervall /p matemaatilise ootuse suhtes sümmeetriliseks. Sel juhul seadus k n _ x (v) asümmeetriline. Leppigem kokku, et valime intervalli /p nii, et suuruse väljundi tõenäosused V väljaspool intervalli paremale ja vasakule (varjutatud alad joonisel 14.4.1) olid samad ja võrdsed

Selle omadusega intervalli / p konstrueerimiseks kasutame tabelit. 4 rakendust: see sisaldab numbreid y) selline, et

koguse eest V, millel on x 2 -jaotus r vabadusastmega. Meie puhul r = n- 1. Paranda r = n- 1 ja leidke tabeli vastavalt realt. 4 kaks väärtust x 2 -üks vastab tõenäosusele teine ​​- tõenäosused Märgime need

väärtused kell 2 ja xl? Intervall on y 2 , vasakuga ja y ~õige ots.

Nüüd leiame nõutava usaldusvahemiku /| dispersiooni jaoks piiridega D, ja D2, mis katab asja D tõenäosusega p:

Koostame sellise intervalli / (, = (?> b A), mis katab punkti D siis ja ainult siis, kui väärtus V langeb intervalli / r. Näitame, et intervall

vastab sellele tingimusele. Tõepoolest, ebavõrdsus on samaväärsed ebavõrdsusega

ja need ebavõrdsused kehtivad tõenäosusega p. Seega leitakse dispersiooni usaldusvahemik ja seda väljendatakse valemiga (14.4.13).

Näide 3. Leidke dispersiooni usaldusvahemik alajaotise 14.3 näite 2 tingimustel, kui on teada, et väärtus X normaalselt jaotatud.

Lahendus. Meil on . Taotluse tabeli 4 kohaselt

leiame aadressil r = n - 1 = 19

Valemi (14.4.13) järgi leiame dispersiooni usaldusvahemiku

Standardhälbe vastav intervall: (0,21; 0,32). See intervall ületab vaid pisut intervalli (0,21; 0,29), mis saadi alajao 14.3 näites 2 ligikaudse meetodiga.

  • Joonis 14.3.1 vaatleb usaldusvahemikku, mis on sümmeetriline a suhtes. Üldiselt, nagu hiljem näeme, pole see vajalik.

Usaldusintervallid ( Inglise Usaldusintervallid) üks statistikas kasutatavatest intervallhinnangute tüüpidest, mis arvutatakse antud olulisuse taseme jaoks. Need võimaldavad väita, et üldkogumi tundmatu statistilise parameetri tegelik väärtus on saadud väärtuste vahemikus tõenäosusega, mille annab valitud statistilise olulisuse tase.

Normaaljaotus

Kui andmete üldkogumi dispersioon (σ 2 ) on teada, saab usalduspiiride (usaldusvahemiku piiripunktide) arvutamiseks kasutada z-skoori. Võrreldes t-jaotuse kasutamisega ei anna z-skoori kasutamine mitte ainult kitsamat usaldusvahemikku, vaid annab ka keskmise ja standardhälbe (σ) usaldusväärsemaid hinnanguid, kuna Z-skoor põhineb normaaljaotusel.

Valem

Usaldusvahemiku piiripunktide määramiseks, eeldusel et andmete üldkogumi standardhälve on teada, kasutatakse järgmist valemit

L = X - Z a/2 σ
√n

Näide

Oletame, et valimi suurus on 25 vaatlust, valimi keskmine on 15 ja üldkogumi standardhälve on 8. Olulisuse taseme α=5% korral on Z-skoor Z α/2 =1,96. Sel juhul on usaldusvahemiku alumine ja ülemine piir

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Seega võime väita, et 95% tõenäosusega langeb üldrahvastiku matemaatiline ootus vahemikku 11,864 kuni 18,136.

Meetodid usaldusvahemiku kitsendamiseks

Oletame, et vahemik on meie uuringu jaoks liiga lai. Usaldusvahemiku vahemiku vähendamiseks on kaks võimalust.

  1. Vähendage statistilise olulisuse taset α.
  2. Suurendage valimi suurust.

Vähendades statistilise olulisuse taseme α=10%, saame Z-skoori, mis on võrdne Z α/2 =1,64. Sel juhul on intervalli alumine ja ülemine piir

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Ja usaldusvahemiku enda saab kirjutada kui

Sel juhul võime eeldada, et 90% tõenäosusega langeb üldkogumi matemaatiline ootus vahemikku.

Kui tahame säilitada statistilise olulisuse taset α, on ainus alternatiiv valimi suurust suurendada. Suurendades selle 144 vaatluseni, saame järgmised usalduspiiride väärtused

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Usaldusvahemik ise näeb välja selline:

Seega on usaldusvahemiku kitsendamine ilma statistilise olulisuse taset vähendamata võimalik ainult valimi suuruse suurendamisega. Kui valimi suurust ei ole võimalik suurendada, saab usaldusvahemiku kitsendamise saavutada ainult statistilise olulisuse taseme vähendamisega.

Usaldusvahemiku loomine mittenormaalse jaotuse jaoks

Kui üldkogumi standardhälve ei ole teada või jaotus on ebanormaalne, kasutatakse usaldusvahemiku koostamiseks t-jaotust. See tehnika on Z-skooril põhineva tehnikaga võrreldes konservatiivsem, mis väljendub laiemates usaldusvahemikes.

Valem

Usaldusvahemiku alumise ja ülemise piiri arvutamiseks t-jaotuse põhjal kasutatakse järgmisi valemeid

L = X - tα σ
√n

Studenti jaotus või t-jaotus sõltub ainult ühest parameetrist - vabadusastmete arvust, mis võrdub üksikute tunnuste väärtuste arvuga (vaatluste arv valimis). Studenti t-testi väärtuse etteantud arvu vabadusastmete (n) ja statistilise olulisuse taseme α korral leiate otsingutabelitest.

Näide

Oletame, et valimi suurus on 25 üksikväärtust, valimi keskmine on 50 ja valimi standardhälve on 28. Statistilise olulisuse taseme α=5% jaoks peate konstrueerima usaldusvahemiku.

Meie puhul on vabadusastmete arv 24 (25-1), mistõttu Studenti t-testi vastav tabeliväärtus statistilise olulisuse taseme α=5% korral on 2,064. Seetõttu on usaldusvahemiku alumine ja ülemine piir

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Ja intervalli enda saab kirjutada kui

Seega võime väita, et 95% tõenäosusega jääb üldrahvastiku matemaatiline ootus vahemikku.

T-jaotuse kasutamine võimaldab kitsendada usaldusvahemikku, vähendades statistilist olulisust või suurendades valimi suurust.

Vähendades meie näite tingimustes statistilise olulisuse 95%-lt 90%-le, saame Studenti t-testi 1,711 vastava tabeliväärtuse.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Sel juhul võime öelda, et 90% tõenäosusega jääb üldrahvastiku matemaatiline ootus vahemikku.

Kui me ei soovi statistilist olulisust vähendada, on ainus alternatiiv valimi suurust suurendada. Oletame, et see on 64 üksikvaatlust, mitte 25, nagu näite algseisundis. Studenti t-testi tabeliväärtus 63 vabadusastme (64-1) ja statistilise olulisuse taseme α=5% korral on 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

See annab meile võimaluse kinnitada, et 95% tõenäosusega jääb üldrahvastiku matemaatiline ootus vahemikku.

Suured proovid

Suured valimid on rohkem kui 100 üksikvaatlust sisaldavate andmete populatsiooni valimid Statistilised uuringud on näidanud, et suuremad valimid kipuvad olema normaalselt jaotunud, isegi kui üldkogumi jaotus ei ole normaalne. Lisaks annab selliste valimite puhul z-skoori ja t-jaotuse kasutamine usaldusvahemike koostamisel ligikaudu samad tulemused. Seega on suurte valimite puhul aktsepteeritav t-jaotuse asemel normaaljaotuse jaoks kasutada z-skoori.

Summeerida

Usaldusvahemik on statistilise suuruse piirväärtused, mis antud usaldustõenäosusega γ on selles intervallis suurema valimi suurusega. Tähistatakse kui P(θ - ε . Praktikas valitakse usaldustõenäosus γ väärtuste γ = 0,9, γ = 0,95, γ = 0,99 hulgast, mis on piisavalt lähedal ühtsusele.

Teenindusülesanne. See teenus määratleb:

  • üldkeskmise usaldusvahemik, dispersiooni usaldusvahemik;
  • standardhälbe usaldusvahemik, üldmurru usaldusvahemik;
Saadud lahendus salvestatakse Wordi faili (vt näidet). Allpool on videoõpetus algandmete täitmiseks.

Näide nr 1. Kolhoosis tehti 1000-pealisest lambakarjast valikuline kontrollpügamine 100-le. Selle tulemusel määrati lamba keskmine villalõikus 4,2 kg. Määrake tõenäosusega 0,99 valimi standardviga keskmise villanihke määramisel lamba kohta ja nihkeväärtuse piirid, kui dispersioon on 2,5. Näidis ei ole korduv.
Näide nr 2. Moskva Põhjatolli postil imporditud toodete partiist võeti pistelise kordusproovi võtmise järjekorras 20 toote "A" proovi. Kontrolli tulemusena tehti kindlaks toote "A" keskmine niiskusesisaldus proovis, mis osutus 6% standardhälbega 1%.
Määrake tõenäosusega 0,683 toote keskmise niiskusesisalduse piirid kogu imporditud toodete partiis.
Näide nr 3. 36 üliõpilast hõlmanud küsitlus näitas, et nende poolt loetud õpikute keskmine arv õppeaastas osutus 6. Kui eeldada, et üliõpilase poolt loetud õpikute arv semestris on normaaljaotusseadusega, mille standardhälve võrdub 6-ga, leia : A) selle juhusliku suuruse matemaatilise ootuse usaldusväärsusega 0,99 intervallhinnangut; B) kui suure tõenäosusega saab väita, et selle valimi kohta arvutatud keskmine õpikute arv, mida üliõpilase loeb semestris, erineb absoluutväärtuses matemaatilisest ootusest mitte rohkem kui 2 võrra.

Usaldusvahemike klassifikatsioon

Hinnatava parameetri tüübi järgi:

Proovi tüübi järgi:

  1. Usaldusvahemik lõpmatu proovivõtu jaoks;
  2. lõpliku proovi usaldusvahemik;
Proovivõttu nimetatakse kordusproovi võtmiseks, kui valitud objekt tagastatakse üldkogumisse enne järgmise valimist. Valimit nimetatakse mittekorduvaks. kui valitud objekti üldkogumisse ei tagastata. Praktikas tegeletakse tavaliselt mittekorduvate proovidega.

Juhusliku valiku keskmise valimivea arvutamine

Valimist saadud näitajate väärtuste ja üldkogumi vastavate parameetrite lahknevust nimetatakse esindusviga.
Üld- ja valimikogumi põhiparameetrite tähistused.
Keskmiste veavalemite näidis
uuesti valikmittekorduv valik
keskmise jaoksjagamisekskeskmise jaoksjagamiseks
Suhe diskreetimisvea piiri (Δ) vahel on teatud tõenäosusega garanteeritud P(t), ja keskmine diskreetimisviga on kujul: või Δ = t μ, kus t– usalduskoefitsient, mis määratakse sõltuvalt tõenäosuse tasemest P(t) integraalfunktsiooni Laplace'i tabeli järgi.

Valemid valimi suuruse arvutamiseks õige juhusliku valiku meetodiga

Seotud väljaanded