Kuidas arvutada standardhälvet. Dispersioon, ruutkeskmine (standard)hälve, variatsioonikoefitsient

Õppetund number 4

Teema: “Kirjeldav statistika. Tunnuse mitmekesisuse näitajad agregaadis "

Peamised kriteeriumid tunnuse mitmekesisuse kohta statistilises populatsioonis on: piir, amplituud, standardhälve, võnkekoefitsient ja variatsioonikoefitsient. Eelmises õppetükis arutati, et keskmised väärtused annavad ainult uuritava tunnuse üldistava tunnuse koondnäitajana ega võta arvesse selle üksikute variantide väärtusi: miinimum- ja maksimumväärtused, üle keskmise. , alla keskmise jne.

Näide. Kahe erineva numbrilise jada keskmised väärtused: -100; - kakskümmend; 100; 20 ja 0,1; -0,2; 0,1 on täpselt samad ja võrdsedO.Nende suhteliste keskmiste järjestuste andmete hajumise vahemikud on aga väga erinevad.

Loetletud tunnuse mitmekesisuse kriteeriumide määratlemisel võetakse eelkõige arvesse selle väärtust statistilise üldkogumi üksikute elementide jaoks.

Tunnuse varieerumise mõõtmise indikaatorid on absoluutne ja sugulane. Variatsiooni absoluutnäitajate hulka kuuluvad: variatsioonivahemik, piir, standardhälve, dispersioon. Variatsioonitegur ja võnketegur viitavad suhtelistele variatsioonimõõtudele.

Limiit (lim) – see on kriteerium, mille määravad variatsiooniseeria variandi äärmuslikud väärtused. Teisisõnu, see kriteerium on piiratud atribuudi minimaalse ja maksimaalse väärtusega:

Amplituud (am) või variatsiooni vahemik - see on äärmuste erinevus. Selle kriteeriumi arvutamiseks lahutatakse atribuudi maksimaalsest väärtusest selle minimaalne väärtus, mis võimaldab hinnata variandi hajuvusastet:

Piiri ja amplituudi kui varieeruvuse kriteeriumide puuduseks on see, et need sõltuvad täielikult variatsioonirea tunnuse äärmuslikest väärtustest. Sel juhul ei võeta seeriasiseseid atribuudi väärtuste kõikumisi arvesse.

Kõige täielikuma iseloomustuse tunnuse mitmekesisusele statistilises populatsioonis annab standardhälve(sigma), mis on variandi keskmisest väärtusest kõrvalekaldumise üldmõõt. Standardhälvet nimetatakse sageli ka kui standardhälve.

Standardhälbe aluseks on iga variandi võrdlus selle üldkogumi aritmeetilise keskmisega. Kuna agregaadis on alati valikuid nii sellest vähem kui ka rohkem, siis tähisega "" olevate kõrvalekallete summa hüvitatakse tähisega "" kõrvalekaldumise summaga, s.o. kõigi kõrvalekallete summa on null. Et vältida erinevuste märkide mõju, võetakse variandi kõrvalekalded aritmeetilisest keskmisest ruudus, s.o. . Ruuthälvete summa ei ole võrdne nulliga. Muutuvust mõõtva koefitsiendi saamiseks võtke ruutude summa keskmine - seda väärtust nimetatakse dispersioon:

Definitsiooni järgi on dispersioon tunnuse üksikute väärtuste kõrvalekallete keskmine ruut selle keskmisest väärtusest. Dispersioon ruudu standardhälve .

Dispersioon on mõõtmete suurus (nimetatakse). Seega, kui arvuridade variandid on väljendatud meetrites, siis dispersioon annab ruutmeetreid; kui variandid on väljendatud kilogrammides, siis dispersioon annab selle mõõdu ruudu (kg 2) jne.

Standardhälve on dispersiooni ruutjuur:

, siis murru nimetaja dispersiooni ja standardhälbe arvutamisel asemelon vaja panna.

Standardhälbe arvutamise võib jagada kuueks etapiks, mis tuleb läbi viia kindlas järjekorras:

Standardhälbe rakendamine:

a) hinnata variatsiooniridade kõikumist ja aritmeetiliste keskmiste tüüpilisuse (representatiivsuse) võrdlevat hindamist. See on vajalik diferentsiaaldiagnostikas märkide stabiilsuse määramisel.

b) variatsiooniridade rekonstrueerimiseks, s.o. alusel selle sageduskarakteristiku taastamine kolm sigma reeglit. Vaheajal (М±3σ) seeria kõigist variantidest on 99,7% vahemikus (М±2σ) - 95,5% ja intervallis (М±1σ) - 68,3% reavalik(Joonis 1).

c) "hüpikakna" valikute tuvastamiseks

d) määrata normi ja patoloogia parameetrid sigma hinnangute abil

e) variatsioonikoefitsiendi arvutamiseks

e) arvutada aritmeetilise keskmise keskmine viga.

Iseloomustamaks mis tahes üldpopulatsiooni, millel onnormaaljaotuse tüüp , piisab kahe parameetri teadmisest: aritmeetilisest keskmisest ja standardhälbest.

Joonis 1. Kolme sigma reegel

Näide.

Pediaatrias kasutatakse standardhälvet laste füüsilise arengu hindamiseks, võrreldes konkreetse lapse andmeid vastavate standardnäitajatega. Standardiks on võetud tervete laste füüsilise arengu aritmeetilised keskmised näitajad. Näitajate võrdlemine standarditega toimub spetsiaalsete tabelite järgi, milles on toodud standardid koos neile vastavate sigmaskaaladega. Arvatakse, et kui lapse füüsilise arengu näitaja jääb normi (aritmeetilise keskmise) ±σ piiresse, siis lapse füüsiline areng (selle näitaja järgi) vastab normile. Kui indikaator jääb normi ±2σ piiresse, siis on normist väike kõrvalekalle. Kui indikaator ületab neid piire, erineb lapse füüsiline areng normist järsult (patoloogia on võimalik).

Lisaks absoluutväärtustes väljendatud variatsiooninäitajatele kasutatakse statistilistes uuringutes suhtelistes väärtustes väljendatud variatsiooninäitajaid. võnkekoefitsient - see on variatsioonivahemiku ja tunnuse keskmise väärtuse suhe. Variatsioonikoefitsient - see on standardhälbe ja tunnuse keskmise väärtuse suhe. Tavaliselt väljendatakse neid väärtusi protsentides.

Suhteliste variatsiooninäitajate arvutamise valemid:

Ülaltoodud valemitest on näha, et mida suurem on koefitsient V nullilähedane, seda väiksem on tunnuse väärtuste kõikumine. Rohkem V, seda muutuvam on märk.

Statistilises praktikas kasutatakse kõige sagedamini variatsioonikordajat. Seda ei kasutata mitte ainult varieeruvuse võrdlevaks hindamiseks, vaid ka populatsiooni homogeensuse iseloomustamiseks. Hulk loetakse homogeenseks, kui variatsioonikoefitsient ei ületa 33% (normaallähedaste jaotuste korral). Aritmeetiliselt välistab σ ja aritmeetilise keskmise suhe nende tunnuste absoluutväärtuse mõju ning protsentuaalne suhe muudab variatsioonikordaja mõõtmeteta (nimeta) väärtuseks.

Saadud variatsioonikordaja väärtust hinnatakse tunnuse mitmekesisuse astme ligikaudsete gradatsioonide järgi:

nõrk - kuni 10%

Keskmine – 10–20%

Tugev - üle 20%

Variatsioonikoefitsiendi kasutamine on soovitatav juhtudel, kui on vaja võrrelda erineva suuruse ja mõõtmetega tunnuseid.

Variatsiooniteguri ja muude hajuvuskriteeriumide erinevust näitab selgelt näiteks.

Tabel 1

Tööstusettevõtte töötajate koosseis

Näites toodud statistiliste tunnuste põhjal võib järeldada, et ettevõtte töötajate vanuseline koosseis ja haridustase on suhteliselt homogeensed ning uuritava kontingendi tööalane stabiilsus on madal. On lihtne mõista, et katse hinnata neid sotsiaalseid suundumusi standardhälbe järgi viiks ekslikule järeldusele ning katse võrrelda raamatupidamistunnuseid "töökogemus" ja "vanus" raamatupidamistunnusega "haridus" oleks üldiselt nende tunnuste heterogeensuse tõttu valed.

Mediaan ja protsentiilid

Järjekorrajaotuste (järgu) korral, kus rea keskkoha kriteeriumiks on mediaan, ei saa standardhälvet ja dispersiooni kasutada variandi dispersiooni tunnustena.

Sama kehtib ka avatud variatsiooniseeriate kohta. See asjaolu on tingitud asjaolust, et hälbed, mille järgi dispersioon ja σ arvutatakse, arvestatakse aritmeetilisest keskmisest, mida ei arvutata avatud variatsiooniridades ja kvalitatiivsete tunnuste jaotuste reas. Seetõttu kasutatakse jaotuste tihendatud kirjelduse jaoks teist hajumise parameetrit - kvantiil(sünonüüm - "protsentiil"), sobib kvalitatiivsete ja kvantitatiivsete tunnuste kirjeldamiseks nende mis tahes jaotusvormis. Seda parameetrit saab kasutada ka kvantitatiivsete tunnuste teisendamiseks kvalitatiivseteks. Sel juhul määratakse sellised hinded sõltuvalt sellest, milline kvantiili järjekord vastab ühele või teisele konkreetsele valikule.

Biomeditsiiniliste uuringute praktikas kasutatakse kõige sagedamini järgmisi kvantiile:

– mediaan;

, on kvartiilid (kvartiilid), kus on alumine kvartiil, ülemine kvartiil.

Kvantiilid jagavad variatsioonirea võimalike muutuste ala teatud intervallideks. Mediaan (kvantiil) on variant, mis asub variatsioonirea keskel ja jagab selle seeria pooleks, kaheks võrdseks osaks ( 0,5 ja 0,5 ). Kvartiil jagab seeria neljaks osaks: esimene osa (alumine kvartiil) on optsioonid, mis eraldavad optsioone, mille arvväärtused ei ületa 25% selles seerias maksimaalsest võimalikust, kvartiil eraldab optsioonid numbrilise väärtusega kuni 50 % maksimaalsest võimalikust. Ülemine kvartiil () eraldab valikud kuni 75% maksimaalsetest võimalikest väärtustest.

Asümmeetrilise jaotuse korral muutuja aritmeetilise keskmise suhtes, selle iseloomustamiseks kasutatakse mediaani ja kvartiile. Sel juhul kasutatakse keskmise väärtuse kuvamiseks järgmist vormi - Mina (;). Näiteks, on uuritav tunnus - "periood, mil laps hakkas iseseisvalt kõndima" - uuringurühmas asümmeetrilise jaotusega. Samal ajal vastab alumine kvartiil () kõndimise algusele - 9,5 kuud, mediaan - 11 kuud, ülemine kvartiil () - 12 kuud. Vastavalt sellele esitatakse määratud atribuudi keskmise trendi tunnuseks 11 (9,5; 12) kuud.

Õppetulemuste statistilise olulisuse hindamine

Andmete statistilise olulisuse all mõistetakse nende vastavust kuvatavale reaalsusele, s.o. Statistiliselt olulised andmed on need, mis ei moonuta ja kajastavad õigesti objektiivset tegelikkust.

Uuringu tulemuste statistilise olulisuse hindamine tähendab kindlaks teha, millise tõenäosusega on võimalik valimi populatsioonil saadud tulemusi üle kanda kogu populatsioonile. Statistilise olulisuse hindamine on vajalik selleks, et mõista, kui palju nähtuse osa saab kasutada nähtuse kui terviku ja selle mustrite hindamiseks.

Uuringu tulemuste statistilise olulisuse hindamine koosneb:

1. esindusvead (keskmiste ja suhteliste väärtuste vead) - m;

2. keskmiste või suhteliste väärtuste usalduspiirid;

3. keskmiste või suhteliste väärtuste erinevuse usaldusväärsus vastavalt kriteeriumile t.

Aritmeetilise keskmise standardviga või esindusviga iseloomustab keskmise kõikumist. Tuleb märkida, et mida suurem on valimi suurus, seda väiksem on keskmiste väärtuste levik. Keskmise standardviga arvutatakse järgmise valemi abil:

Kaasaegses teaduskirjanduses kirjutatakse aritmeetiline keskmine koos representatiivsusveaga:

või koos standardhälbega:

Vaatleme näiteks riigi 1500 linnapolikliiniku andmeid (üldelanikkond). Keskmine polikliinikus teenindatavate patsientide arv on 18150 inimest. Juhuslik valik 10% objektidest (150 polikliinikut) annab keskmiseks patsientide arvuks 20051 inimest. Valimi võtmise viga, mis on ilmselgelt seotud asjaoluga, et valimisse ei kuulunud kõik 1500 polikliinikut, on võrdne nende keskmiste erinevusega - üldkeskmise ( M geen) ja proovi keskmine ( M sb). Kui moodustame oma populatsioonist teise sama suurusega valimi, annab see erineva koguse vea. Kõik need valimi keskmised piisavalt suurte valimitega jaotuvad tavaliselt üldkeskmise ümber, kusjuures üldkogumi sama arvu objektide valimi korduste arv on piisavalt suur. Keskmise standardviga m on valimi keskmiste vältimatu levik ümber üldkeskmise.

Juhul, kui uuringu tulemusi esindavad suhtelised väärtused (näiteks protsendid), jagamise standardviga:

kus P on näitaja %, n on vaatluste arv.

Tulemus kuvatakse kujul (P ± m)%. Näiteks, paranemise protsent patsientide seas oli (95,2±2,5)%.

Kui elementide arv populatsioonis, siis keskmise ja murdosa nimetaja osakaalu standardvigade arvutamisel asemelon vaja panna.

Normaaljaotuse korral (valimi keskmiste jaotus on normaalne) on teada, kui suur osa populatsioonist jääb mis tahes keskmist ümbritsevasse intervalli. Eriti:

Praktikas seisneb probleem selles, et üldkogumi tunnused on meile tundmatud ning valim tehakse just nende hindamise eesmärgil. See tähendab, et kui võtame sama suurusega proovid nüldkogumikust, siis 68,3% juhtudest sisaldab intervall väärtust M(95,5% juhtudest on see intervallil ja 99,7% juhtudest intervallil).

Kuna tegelikult tehakse ainult üks valim, on see väide sõnastatud tõenäosuse alusel: tõenäosusega 68,3% sisaldub intervallis atribuudi keskmine väärtus üldkogumis, tõenäosusega 95,5%. - intervallis jne.

Praktikas ehitatakse selline intervall valimi väärtuse ümber, mis antud (piisavalt suure) tõenäosusega usalduse tõenäosus -"kataks" selle parameetri tegeliku väärtuse üldpopulatsioonis. Seda intervalli nimetatakse usaldusvahemik.

Usalduse tõenäosusP on usalduse aste, et usaldusvahemik tõepoolest sisaldab parameetri tõelist (tundmatut) väärtust populatsioonis.

Näiteks kui usaldustase R võrdne 90%, see tähendab, et 90 proovi 100-st annavad parameetri õige hinnangu üldkogumis. Vastavalt sellele on vea tõenäosus, s.o. valimi üldkeskmise vale hinnang, võrdub protsentides: . Selle näite puhul tähendab see, et 10 proovi 100-st annavad vale hinnangu.

Ilmselgelt sõltub usalduse aste (usaldustõenäosus) intervalli suurusest: mida laiem on intervall, seda suurem on kindlus, et üldkogumi jaoks tundmatu väärtus sellesse langeb. Praktikas võetakse vähemalt 95,5% usaldusväärsuse tagamiseks usaldusvahemiku koostamiseks vähemalt kaks korda suurem valimiviga.

Keskmiste ja suhteliste väärtuste usalduspiiride määramine võimaldab meil leida nende kaks äärmist väärtust - minimaalne võimalik ja maksimaalne võimalik, mille piires võib uuritav näitaja esineda kogu üldpopulatsioonis. Selle põhjal usalduspiirid (või usaldusvahemik)- need on keskmiste või suhteliste väärtuste piirid, mille ületamine juhuslike kõikumiste tõttu on ebaoluline.

Usaldusvahemiku saab ümber kirjutada järgmiselt: , kus t on usalduskriteerium.

Aritmeetilise keskmise usalduspiirid üldkogumis määratakse järgmise valemiga:

M geen = M vali + tm M

suhtelise väärtuse jaoks:

R geen = P vali + tm R

kus M geen ja R geen- üldrahvastiku keskmiste ja suhteliste väärtuste väärtused; M vali ja R vali- valimipopulatsioonis saadud keskmiste ja suhteliste väärtuste väärtused; m M ja m P- keskmiste ja suhteliste väärtuste vead; t- usalduskriteerium (täpsuskriteerium, mis määratakse uuringu planeerimisel ja võib olla võrdne 2 või 3-ga); tm- see on usaldusvahemik ehk Δ - valimuuringus saadud näitaja piirviga.

Tuleb märkida, et kriteeriumi väärtus t teatud määral on see seotud veavaba prognoosi tõenäosusega (p), väljendatuna protsentides. Selle valib uurija ise, juhindudes vajadusest saada nõutava täpsusega tulemus. Seega veavaba prognoosi tõenäosuse 95,5% korral on kriteeriumi väärtus t on 2, 99,7% - 3 puhul.

Usaldusvahemiku antud hinnangud on vastuvõetavad ainult statistiliste üldkogumite puhul, kus vaatlusi on rohkem kui 30. Väiksema populatsiooni (väikesed valimid) korral kasutatakse kriteeriumi t määramiseks spetsiaalseid tabeleid. Nendes tabelites on soovitud väärtus populatsiooni suurusele vastava joone ristumiskohas (n-1), ja veerg, mis vastab teadlase valitud veavaba prognoosi tõenäosuse tasemele (95,5%; 99,7%). Meditsiiniuuringutes on mis tahes näitaja usalduspiiride kehtestamisel veavaba prognoosi tõenäosus 95,5% või rohkem. See tähendab, et valimikogumi pealt saadud näitaja väärtus tuleb leida üldkogumist vähemalt 95,5% juhtudest.

    Küsimused tunni teemal:

    Tunnuse mitmekesisuse näitajate asjakohasus statistilises üldkogumis.

    Absoluutsete variatsiooninäitajate üldkarakteristikud.

    Standardhälve, arvutamine, rakendamine.

    Variatsiooni suhtelised näitajad.

    Mediaan, kvartiil.

    Uuringu tulemuste statistilise olulisuse hindamine.

    Aritmeetilise keskmise standardviga, arvutusvalem, kasutusnäide.

    Aktsia ja selle standardvea arvutamine.

    Usaldustõenäosuse mõiste, kasutusnäide.

10. Usaldusvahemiku mõiste, selle rakendamine.

    Teemakohased testülesanded näidisvastustega:

1. VARIATSIOONI ABSOLUUTSED NÄITAJAD ON

1) variatsioonikoefitsient

2) võnkekoefitsient

4) mediaan

2. VARIATSIOONI SUHTELISED NÄITAJAD ON

1) dispersioon

4) variatsioonikoefitsient

3. KRITEERIUM, MIS MÄÄRATAB VARIANDI ERIVÄÄRTUSTE ÜLEMINE

2) amplituud

3) hajutamine

4) variatsioonikoefitsient

4. Äärmusvariandi ERINE ON

2) amplituud

3) standardhälve

4) variatsioonikoefitsient

5. ÜKSIK OLLULISTE VÄÄRTUSTE KESKMIST VÄÄRTUSEST HÕLMETE KESKMINE RUUT ON

1) võnkekoefitsient

2) mediaan

3) hajutamine

6. VARIUMISE VALIKUMISE SUHE FUNKTSIOONI KESKMISSE VÄÄRTUSSE ON

1) variatsioonikoefitsient

2) standardhälve

4) võnkekoefitsient

7. KESKMISE RUUTHÕLLEMISE SUHE MÄRKUSE KESKMISSE VÄÄRTUSSE ON

1) dispersioon

2) variatsioonikoefitsient

3) võnketegur

4) amplituud

8. VARIANT, MIS ON VARIATSIOONIDE SERIA KESKES JA JAGAB SELLE KAHEKS VÕRDSEKS OSAKS ON

1) mediaan

3) amplituud

9. MEDITSIINILISES UURINGUS MIS TAHES INDIKAATORI KINNITUSPIIRIDE KOHTAMISEL AKTSEPTEERITAKSE VEATETA ENNUSTUSE TÕENÄOSUSE.

10. KUI 90 PROOVI 100-st ANNAVAD ÜLDPOPULATSIOONI PARAMEETRI ÕIGE HINNAGU, SIIS TÄHENDAB SEE, ET KINNITUSE TÕENÄOSUS P VÕRDSED

11. JUHUL, KUI 10 PROOVI 100-st ANNAB VALE HINNANGUSE, ON VEA TÕENÄOSUS

12. KESKMISTE VÕI SUHTELISTE VÄÄRTUSTE PIIRID, JUHUSLIKE VÕNKUMISTE TÕTTU ON VÄIKE TÕENÄOSUS PIIRIDEST ÜLE MINNA – SEE

1) usaldusvahemik

2) amplituud

4) variatsioonikoefitsient

13. VÄIKSEKS VALIMIKS LOETAKSE, KELLES

1) n on väiksem kui 100 või sellega võrdne

2) n on väiksem kui 30 või sellega võrdne

3) n on väiksem kui 40 või sellega võrdne

4) n on nullilähedane

14. 95% KRITEERIUMI VÄÄRTUSE VEATEVABA PROGNOOSIDE TÕENÄOSUSE KOHTA t KOOSTAB

15. 99% KRITEERIUMI VÄÄRTUSE VEATEVABA PROGNOOSIDE TÕENÄOSUSE KOHTA t KOOSTAB

16. NORMAALSELE LÄHEDASTE JAOTUSTE PUHUL LOETAKSE RAHVASTIK HOMOGEENSEKS, KUI VARIatsiooniKOefitsient EI ÜLETA

17. VALIK ERALDAMISVARIANDID, MILLE ARVUVÄÄRTUSED EI ÜLE 25% SELLEL REAAL MAKSIMAALSEST VÕIMALIKUst

2) alumine kvartiil

3) ülemine kvartiil

4) kvartiil

18. ANDMEID, MIS EI MOONUTA JA OBJEKTIIVSET REAALSUST ÕIGESTI Peegeldavad, nimetatakse

1) võimatu

2) võrdselt võimalik

3) usaldusväärne

4) juhuslik

19. VASTAVALT KOLME SIGMI REEGLILE, MÄRGI TAVALIKU JAOTUSEGA SEES
ASUTAKSE

1) 68,3% optsioon

Hüpoteeside statistilisel testimisel, juhuslike suuruste vahelise lineaarse seose mõõtmisel.

Standardhälve:

Standardhälve(juhusliku suuruse põrand, meid ümbritsevad seinad ja lagi standardhälbe hinnang, x võrreldes selle matemaatilise ootusega, mis põhineb selle dispersiooni erapooletul hinnangul):

kus - dispersioon; - põrand, meid ümbritsevad seinad ja lagi, i-th proovi element; - näidissuurus; - valimi aritmeetiline keskmine:

Tuleb märkida, et mõlemad hinnangud on kallutatud. Üldjuhul on erapooletu hinnangu koostamine võimatu. Siiski on erapooletu dispersioonihinnangul põhinev hinnang järjepidev.

kolme sigma reegel

kolme sigma reegel() - peaaegu kõik normaalse jaotusega juhusliku suuruse väärtused asuvad intervallis. Täpsemalt - mitte vähem kui 99,7% kindlusega asub normaalse jaotusega juhusliku muutuja väärtus määratud intervallis (eeldusel, et väärtus on tõene, mitte ei saadud valimi töötlemise tulemusena).

Kui tegelik väärtus on teadmata, siis peaksite kasutama mitte, vaid põrandat, meid ümbritsevaid seinu ja lage, s. Seega on kolme sigma reegel tõlgitud kolme reegliks. Põrand, seinad meie ümber ja lagi, s .

Standardhälbe väärtuse tõlgendamine

Suur standardhälbe väärtus näitab väärtuste suurt levikut esitatud komplektis koos komplekti keskmise väärtusega; vastavalt väike väärtus näitab, et komplekti väärtused on rühmitatud keskmise väärtuse ümber.

Näiteks on meil kolm arvukomplekti: (0, 0, 14, 14), (0, 6, 8, 14) ja (6, 6, 8, 8). Kõigi kolme komplekti keskmised väärtused on 7 ja standardhälbed vastavalt 7, 5 ja 1. Viimasel komplektil on väike standardhälve, kuna komplekti väärtused on koondunud keskmise ümber; esimesel komplektil on standardhälbe suurim väärtus - komplektis olevad väärtused erinevad tugevalt keskmisest väärtusest.

Üldises mõttes võib standardhälvet pidada määramatuse mõõduks. Näiteks füüsikas kasutatakse standardhälvet mingi suuruse järjestikuste mõõtmiste jada vea määramiseks. See väärtus on väga oluline uuritava nähtuse usutavuse määramiseks võrreldes teooria ennustatud väärtusega: kui mõõtmiste keskmine väärtus on väga erinev teooria ennustatud väärtustest (suur standardhälve), siis saadud väärtusi või nende saamise meetodit tuleks uuesti kontrollida.

Praktiline kasutamine

Praktikas võimaldab standardhälve määrata, kui palju võivad komplektis olevad väärtused erineda keskmisest väärtusest.

Kliima

Oletame, et on kaks linna, mille keskmine ööpäevane maksimumtemperatuur on sama, kuid üks asub rannikul ja teine ​​sisemaal. Rannikulinnades on teadaolevalt palju erinevaid ööpäevaseid maksimumtemperatuure vähem kui sisemaa linnades. Seetõttu on rannikulinna maksimaalsete ööpäevaste temperatuuride standardhälve väiksem kui teises linnas, hoolimata asjaolust, et neil on selle väärtuse keskmine väärtus sama, mis praktikas tähendab, et tõenäosus, et maksimaalne õhutemperatuur iga päev aastas on tugevam, erineb keskmisest väärtusest, kõrgem kontinendi sees asuva linna puhul.

Sport

Oletame, et on mitu jalgpallimeeskonda, kes on järjestatud teatud parameetrite järgi, näiteks löödud ja löödud väravate arv, väravavõimalused jne. Suure tõenäosusega on selle grupi parimal meeskonnal parimad väärtused rohkemates parameetrites. Mida väiksem on meeskonna standardhälve iga esitatud parameetri puhul, seda prognoositavam on meeskonna tulemus, sellised meeskonnad on tasakaalus. Seevastu suure standardhälbega meeskonnal on raske tulemust ennustada, mis omakorda on seletatav tasakaalustamatusega, näiteks tugev kaitse, aga nõrk rünnak.

Võistkonna parameetrite standardhälbe kasutamine võimaldab teatud määral ennustada kahe meeskonna omavahelise matši tulemust, hinnates võistkondade tugevaid ja nõrku külgi ning sellest tulenevalt valitud võitlusviise.

Tehniline analüüs

Vaata ka

Kirjandus

* Borovikov, V. STATISTIKA. Arvutiandmete analüüsi kunst: Professionaalidele / V. Borovikov. - Peterburi. : Peeter, 2003. - 688 lk. - ISBN 5-272-00078-1.

Statistilise analüüsi üks peamisi tööriistu on standardhälbe arvutamine. See indikaator võimaldab teil hinnata valimi või üldkogumi standardhälvet. Õpime kasutama Excelis standardhälbe valemit.

Defineerime kohe, mis on standardhälve ja kuidas selle valem välja näeb. See väärtus on seeria kõigi väärtuste ja nende aritmeetilise keskmise erinevuse ruutude aritmeetilise keskmise ruutjuur. Sellel indikaatoril on identne nimi - standardhälve. Mõlemad nimed on täiesti samaväärsed.

Kuid loomulikult ei pea kasutaja Excelis seda arvutama, kuna programm teeb kõik tema eest. Õpime Excelis standardhälbe arvutama.

Arvutamine Excelis

Määratud väärtuse saate Excelis arvutada kahe erifunktsiooni abil STDEV.V(vastavalt näidisele) ja STDEV.G(vastavalt üldrahvastikule). Nende tööpõhimõte on absoluutselt sama, kuid neid saab nimetada kolmel viisil, mida käsitleme allpool.

1. meetod: funktsiooniviisard


2. meetod: valemite vahekaart


3. meetod: valemi käsitsi sisestamine

Samuti on võimalus, et argumentide akent pole üldse vaja kutsuda. Selleks sisestage valem käsitsi.


Nagu näete, on Exceli standardhälbe arvutamise mehhanism väga lihtne. Kasutajal tuleb sisestada vaid populatsioonist pärit numbrid või linke neid sisaldavatele lahtritele. Kõik arvutused teeb programm ise. Palju keerulisem on aru saada, mis on arvutatud näitaja ja kuidas arvutuse tulemusi praktikas rakendada. Kuid selle mõistmine kuulub juba rohkem statistika kui tarkvaraga töötamise õppimise valdkonda.

Lihtsa geomeetrilise keskmise arvutamiseks kasutatakse valemit:

geomeetriline kaalutud

Geomeetrilise kaalutud keskmise määramiseks kasutatakse valemit:

Rataste, torude ja ruutude keskmised küljed määratakse keskmise ruudu abil.

RMS väärtusi kasutatakse mõne näitaja arvutamiseks, näiteks variatsioonikordaja, mis iseloomustab väljundi rütmi. Siin määratakse standardhälve teatud perioodiks kavandatud toodangust järgmise valemiga:

Need väärtused iseloomustavad täpselt majandusnäitajate muutust võrreldes nende baasväärtusega, võttes selle keskmise väärtusena.

Ruutlihtne

Lihtne keskmine ruut arvutatakse järgmise valemiga:

Ruutkaaluline

Kaalutud ruutkeskmine on:

22. Variatsiooni absoluutsed mõõdud hõlmavad järgmist:

variatsiooni ulatus

keskmine lineaarne hälve

dispersioon

standardhälve

Variatsioonivahemik (r)

Laiuse variatsioon on atribuudi maksimaalse ja minimaalse väärtuse erinevus

See näitab piire, milles atribuudi väärtus uuritavas populatsioonis muutub.

Viie taotleja töökogemus eelmisel töökohal on: 2,3,4,7 ja 9 aastat. Lahendus: variatsioonivahemik = 9 - 2 = 7 aastat.

Atribuudi väärtuste erinevuste üldistatud karakteristiku jaoks arvutatakse keskmised variatsiooninäitajad aritmeetilisest keskmisest kõrvalekallete arvestamise alusel. Erinevust võetakse kui kõrvalekallet keskmisest.

Samas, et vältida tunnuse valikute keskmisest kõrvalekallete summa (keskmise nullomadus) nulliks muutumist, tuleb kõrvalekalde märke kas ignoreerida, st võtta see summa modulo. või hälbe väärtused ruudus

Keskmine lineaar- ja ruuthälve

Keskmine lineaarne hälve on atribuudi üksikute väärtuste absoluutsete kõrvalekallete aritmeetiline keskmine keskmisest.

Keskmine lineaarne hälve on lihtne:

Viie taotleja töökogemus eelmisel töökohal on: 2,3,4,7 ja 9 aastat.

Meie näites: aastad;

Vastus: 2,4 aastat.

Keskmine lineaarne hälve kaalutud kehtib rühmitatud andmete kohta:

Keskmist lineaarset hälvet selle konventsionaalsuse tõttu kasutatakse praktikas suhteliselt harva (eelkõige lepinguliste kohustuste täitmise iseloomustamiseks tarne ühetaolisuse osas; toote kvaliteedi analüüsimisel, võttes arvesse tootmise tehnoloogilisi iseärasusi ).

Standardhälve

Kõige täiuslikum variatsiooni tunnus on standardhälve, mida nimetatakse standardiks (või standardhälbeks). Standardhälve() on võrdne tunnuse üksikute väärtuste aritmeetilisest keskmisest kõrvalekallete keskmise ruudu ruutjuurega:

Standardhälve on lihtne:

Kaalutud standardhälvet kasutatakse rühmitatud andmete puhul:

Keskmise ruudu ja keskmise lineaarhälbe vahel normaaljaotuse tingimustes toimub järgmine seos: ~ 1,25.

Standardhälvet, mis on peamine absoluutne variatsioonimõõt, kasutatakse normaaljaotuse kõvera ordinaatide väärtuste määramisel, valimi vaatluse korraldamise ja valimi karakteristikute täpsuse määramisega seotud arvutustes, samuti tunnuse varieerumise piiride hindamine homogeenses populatsioonis.

X i - juhuslikud (praegused) väärtused;

valimi juhuslike muutujate keskmine väärtus arvutatakse järgmise valemiga:

Niisiis, dispersioon on kõrvalekallete keskmine ruut . See tähendab, et kõigepealt arvutatakse keskmine väärtus, seejärel võetakse see iga algväärtuse ja keskmise väärtuse erinevus ruudus , lisatakse ja jagatakse siis antud populatsiooni väärtuste arvuga.

Individuaalse väärtuse ja keskmise erinevus peegeldab kõrvalekalde mõõtu. See on ruudus tagamaks, et kõik kõrvalekalded muutuksid eranditult positiivseteks numbriteks ja et vältida positiivsete ja negatiivsete kõrvalekallete vastastikust tühistamist nende summeerimisel. Seejärel arvutame ruudus hälbeid arvestades lihtsalt aritmeetilise keskmise.

Võlusõna "dispersioon" vihje peitub just nendes kolmes sõnas: keskmine – ruut – kõrvalekalded.

Standardhälve (RMS)

Võttes dispersiooni ruutjuure, saame nn. standardhälve". Nimesid on "standardhälve" või "sigma" (kreeka tähe nimest σ .). Standardhälbe valem on järgmine:

Niisiis, dispersioon on sigma ruudus või - standardhälve ruudus.

Ilmselgelt iseloomustab standardhälve ka andmete hajuvuse mõõtu, kuid nüüd (erinevalt dispersioonist) saab seda võrrelda algandmetega, kuna neil on samad mõõtühikud (see selgub arvutusvalemist). Variatsioonivahemik on äärmuslike väärtuste erinevus. Standardhälvet kui määramatuse mõõdikut kasutatakse ka paljudes statistilistes arvutustes. Tema abiga määratakse erinevate hinnangute ja prognooside täpsusaste. Kui variatsioon on väga suur, siis on ka standardhälve suur, mistõttu on prognoos ebatäpne, mis väljendub näiteks väga laiades usaldusvahemikes.

Seetõttu kasutatakse kinnisvara hindamiste statistilise andmetöötluse meetodites olenevalt ülesande nõutavast täpsusest kahe või kolme sigma reeglit.

Kahe sigma reegli ja kolme sigma reegli võrdlemiseks kasutame Laplace'i valemit:

F - F,

kus Ф(x) on Laplace'i funktsioon;



Minimaalne väärtus

β = maksimaalne väärtus

s = sigma väärtus (standardhälve)

a = keskmine väärtus

Sel juhul kasutatakse Laplace'i valemi konkreetset vormi, kui juhusliku suuruse X väärtuste piirid α ja β on jaotuskeskusest a = M(X) võrdse kaugusel mingi väärtuse d võrra: a = a-d , b = a+d. Või (1) Valem (1) määrab normaaljaotuse seadusega juhusliku suuruse X antud kõrvalekalde d tõenäosuse tema matemaatilisest ootusest М(X) = a. Kui valemis (1) võtame järjestikku d = 2s ja d = 3s, siis saame: (2), (3).

Kahe sigma reegel

Peaaegu usaldusväärselt (usaldustõenäosusega 0,954) võib väita, et kõik normaaljaotuse seadusega juhusliku suuruse X väärtused kalduvad kõrvale tema matemaatilisest ootusest M(X) = a mitte rohkem kui 2s (kaks standardit). kõrvalekalded). Usaldustõenäosus (Pd) on tinglikult usaldusväärseks tunnistatud sündmuste tõenäosus (nende tõenäosus on 1 lähedal).

Illustreerime kahe sigma reeglit geomeetriliselt. Joonisel fig. 6 kujutab Gaussi kõverat jaotuskeskusega a. Kogu kõvera ja Ox-teljega piiratud pindala on 1 (100%) ning abstsisside a–2s ja a+2 vahelise kõverjoonelise trapetsi pindala on kahe sigma reegli kohaselt 0,954 (95,4%). kogupinnast). Varjutatud alade pindala on 1-0,954 = 0,046 (>5% kogupindalast). Neid sektsioone nimetatakse juhusliku suuruse kriitiliseks vahemikuks. Kriitilisesse piirkonda sattuvad juhusliku suuruse väärtused on ebatõenäolised ja praktikas peetakse neid tinglikult võimatuks.

Tinglikult võimatute väärtuste tõenäosust nimetatakse juhusliku suuruse olulisuse tasemeks. Olulisuse tase on seotud usaldustasemega valemiga:

kus q on olulisuse tase, väljendatuna protsentides.

Kolme sigma reegel

Suuremat usaldusväärsust nõudvate küsimuste lahendamisel, kui usalduse tõenäosuseks (Pd) võetakse 0,997 (täpsemalt 0,9973), kasutatakse kahe sigma reegli asemel valemi (3) järgi reeglit. kolm sigmat.



Vastavalt kolme sigma reegel usaldusnivooga 0,9973 on kriitiliseks piirkonnaks atribuutide väärtuste ala väljaspool intervalli (a-3s, a+3s). Olulisuse tase on 0,27%.

Teisisõnu, tõenäosus, et hälbe absoluutväärtus ületab standardhälbe kolm korda, on väga väike, nimelt 0,0027=1-0,9973. See tähendab, et see võib juhtuda vaid 0,27% juhtudest. Selliseid sündmusi, mis lähtuvad ebatõenäoliste sündmuste võimatuse põhimõttest, võib pidada praktiliselt võimatuks. Need. kõrge täpsusega proovide võtmine.

See on kolme sigma reegli olemus:

Kui juhuslik suurus on normaaljaotusega, siis selle matemaatilisest ootusest kõrvalekaldumise absoluutväärtus ei ületa kolmekordset standardhälvet (RMS).

Praktikas rakendatakse kolme sigma reeglit järgmiselt: kui uuritava juhusliku suuruse jaotus on teadmata, kuid eeltoodud reeglis toodud tingimus on täidetud, siis on alust eeldada, et uuritav muutuja jaotub normaalselt; muidu ei levita seda tavaliselt.

Olulisuse tase võetakse sõltuvalt lubatud riskiastmest ja ülesandest. Kinnisvara hindamiseks võetakse tavaliselt kahe sigma reegli järgi vähem täpne proov.

Seotud väljaanded