Probleemide lahendamise näidete vähimruutude meetod. Katseandmete lähendamine

  • Programmeerimine
    • õpetus

    Sissejuhatus

    Olen programmeerija. Tegin oma karjääri suurima hüppe, kui õppisin ütlema: "Ma ei saa millestki aru!" Nüüd ma ei häbene teaduse valgustajale öelda, et ta peab mulle loengut, et ma ei saa aru, millest see, valgusti, minuga räägib. Ja see on väga raske. Jah, on raske ja piinlik tunnistada, et sa ei tea. Kellele meeldib tunnistada, et ta ei tea millegi põhitõdesid-seal. Oma ametist tulenevalt pean osalema paljudel ettekannetel ja loengutel, kus, tunnistan, tunnen valdavalt enamikul juhtudel unisust, sest ma ei saa millestki aru. Ja ma ei saa aru, sest teaduse praeguse olukorra suur probleem seisneb matemaatikas. See eeldab, et kõik õpilased tunnevad absoluutselt kõiki matemaatika valdkondi (mis on absurdne). Tunnistada, et te ei tea, mis on tuletis (et see on veidi hiljem), on häbi.

    Aga ma olen õppinud ütlema, et ma ei tea, mis on korrutamine. Jah, ma ei tea, mis on alamgebra üle Lie algebra. Jah, ma ei tea, miks on ruutvõrrandid elus vaja. Muide, kui olete kindel, et teate, siis on meil millestki rääkida! Matemaatika on trikkide jada. Matemaatikud püüavad avalikkust segadusse ajada ja hirmutada; kus pole segadust, mainet ega autoriteeti. Jah, prestiižne on rääkida võimalikult abstraktses keeles, mis on iseenesest täielik jama.

    Kas sa tead, mis on tuletis? Tõenäoliselt räägite mulle erinevuse suhte piirist. Peterburi Riikliku Ülikooli matemaatika esimesel kursusel Viktor Petrovitš Khavin mind määratletud tuletis kui funktsiooni Taylori seeria esimese liikme koefitsient punktis (see oli eraldi võimlemine Taylori seeria määramiseks ilma tuletisi). Naersin selle määratluse üle kaua, kuni lõpuks sain aru, millega tegu. Tuletis ei ole midagi muud kui lihtsalt mõõt selle kohta, kui palju eristatav funktsioon sarnaneb funktsiooniga y=x, y=x^2, y=x^3.

    Nüüd on mul au pidada loenguid üliõpilastele, kes hirm matemaatika. Kui kardad matemaatikat – oleme teel. Niipea, kui proovite mõnda teksti lugeda ja teile tundub, et see on liiga keeruline, teadke, et see on halvasti kirjutatud. Ma väidan, et pole ühtegi matemaatika valdkonda, millest ei saaks rääkida "näpuga" ilma täpsust kaotamata.

    Lähituleviku väljakutse: andsin õpilastele korralduse mõista, mis on lineaar-ruutkontroller. Ära ole häbelik, raiska kolm minutit oma elust, järgi linki. Kui te millestki aru ei saa, siis oleme teel. Ka mina (professionaalne matemaatik-programmeerija) ei saanud millestki aru. Ja ma kinnitan teile, et seda saab lahendada "näpuga". Praegu ma ei tea, mis see on, kuid ma kinnitan teile, et saame selle välja mõelda.

    Niisiis, esimene loeng, mille ma oma õpilastele pean pärast seda, kui nad õudusega minu juurde jooksevad sõnadega, et lineaar-ruutkontroller on kohutav viga, mida te kunagi oma elus ei valda. vähimruutude meetodid. Kas saate lahendada lineaarvõrrandeid? Kui sa seda teksti loed, siis suure tõenäosusega mitte.

    Seega, kui on antud kaks punkti (x0, y0), (x1, y1), näiteks (1,1) ja (3,2), on ülesandeks leida neid kahte punkti läbiva sirge võrrand:

    illustratsioon

    Sellel sirgel peaks olema järgmine võrrand:

    Siin on alfa ja beeta meile tundmatud, kuid selle joone kaks punkti on teada:

    Selle võrrandi saate kirjutada maatriksi kujul:

    Siin tuleks teha lüüriline kõrvalepõik: mis on maatriks? Maatriks pole midagi muud kui kahemõõtmeline massiiv. See on andmete salvestamise viis, sellele ei tohiks rohkem väärtusi anda. See, kuidas teatud maatriksit täpselt tõlgendada, sõltub meist. Perioodiliselt tõlgendan seda lineaarse kaardistusena, perioodiliselt ruutvormina ja mõnikord lihtsalt vektorite kogumina. Seda kõike selgitatakse kontekstis.

    Asendame konkreetsed maatriksid nende sümboolse esitusega:

    Siis (alfa, beeta) saab hõlpsasti leida:

    Täpsemalt meie varasemate andmete kohta:

    Mis annab punkte (1,1) ja (3,2) läbiva sirge järgmise võrrandi:

    Olgu, siin on kõik selge. Ja leiame läbiva sirge võrrandi kolm punktid: (x0,y0), (x1,y1) ja (x2,y2):

    Oi-oi-oi, aga kahe tundmatu jaoks on meil kolm võrrandit! Tavaline matemaatik ütleb, et lahendust pole. Mida programmeerija ütleb? Ja kõigepealt kirjutab ta eelmise võrrandisüsteemi ümber järgmisel kujul:

    Meie puhul on vektorid i, j, b kolmemõõtmelised, seetõttu (üldjuhul) sellele süsteemile lahendust ei ole. Iga vektor (alfa\*i + beeta\*j) asub vektorite (i, j) poolt katval tasapinnal. Kui b ei kuulu sellele tasapinnale, siis pole lahendust (võrdsust võrrandis ei saa saavutada). Mida teha? Otsime kompromissi. Tähistagem e (alfa, beeta) kuidas me täpselt võrdsust ei saavutanud:

    Ja me püüame seda viga minimeerida:

    Miks ruut?

    Me ei otsi lihtsalt normi miinimumi, vaid normi ruudu miinimumi. Miks? Miinimumpunkt ise langeb kokku ja ruut annab sujuva funktsiooni (argumentide ruutfunktsioon (alfa, beeta)), samas kui lihtsalt pikkus annab funktsiooni koonuse kujul, mis ei ole miinimumpunktis eristatav. Brr. Ruut on mugavam.

    Ilmselt on viga minimeeritud, kui vektor e vektorite poolt hõlmatud tasapinnaga risti i ja j.

    Illustratsioon

    Teisisõnu: otsime joont, mille kõigi punktide ja selle sirgeni ulatuvate kauguste ruudu pikkuste summa on minimaalne:

    VÄRSKENDUS: siin on mul lengi, kaugust joonest tuleks mõõta vertikaalselt, mitte ortograafilise projektsiooniga. kommenteerijal on õigus.

    Illustratsioon

    Täiesti erinevate sõnadega (hoolsalt, halvasti vormistatud, kuid see peaks olema sõrmedel selge): võtame kõik võimalikud jooned kõigi punktipaaride vahel ja otsime kõigi vahelt keskmist joont:

    Illustratsioon

    Veel üks selgitus sõrmede kohta: kinnitame vedru kõigi andmepunktide (siin on kolm) ja otsitava joone vahele ning tasakaaluseisundi joon on täpselt see, mida otsime.

    Ruutvormi miinimum

    Niisiis, vektorit arvestades b ja maatriksi veergude-vektorite poolt haaratud tasapind A(antud juhul (x0,x1,x2) ja (1,1,1)), otsime vektorit e minimaalse ruudu pikkusega. Ilmselgelt on miinimum saavutatav ainult vektori puhul e, risti maatriksi veergude-vektoritega kaetud tasapinnaga A:

    Teisisõnu otsime vektorit x=(alfa, beeta), et:

    Tuletan teile meelde, et see vektor x=(alfa, beeta) on ruutfunktsiooni ||e(alfa, beeta)||^2 miinimum:

    Siin on kasulik meeles pidada, et maatriksit saab tõlgendada nii nagu ruutvormi, näiteks identiteedimaatriksit ((1,0),(0,1)) saab tõlgendada funktsioonina x^2 + y ^2:

    ruutvorm

    Kogu seda võimlemist tuntakse lineaarse regressioonina.

    Laplace'i võrrand Dirichlet' piirtingimusega

    Nüüd kõige lihtsam tegelik probleem: on teatud kolmnurkne pind, seda on vaja siluda. Näiteks laadime minu näomudeli:

    Algne kohustus on saadaval. Väliste sõltuvuste minimeerimiseks võtsin oma tarkvara renderdaja koodi, juba Habré peal. Lineaarse süsteemi lahendamiseks kasutan OpenNL , see on suurepärane lahendaja, kuid seda on väga raske installida: peate kopeerima kaks faili (.h + .c) oma projekti kausta. Kogu silumine toimub järgmise koodiga:

    For (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = näod[i]; jaoks (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

    X, Y ja Z koordinaadid on eraldatavad, silun eraldi. See tähendab, et lahendan kolm lineaarvõrrandisüsteemi, millest igaühel on sama arv muutujaid kui minu mudeli tippude arv. Maatriksi A esimesel n real on ainult üks 1 rea kohta ja vektori b esimesel n real on mudeli algsed koordinaadid. See tähendab, et ma seon uue tipupositsiooni ja vana tipupositsiooni vahele – uued ei tohiks olla vanadest liiga kaugel.

    Kõigil järgnevatel maatriksi A ridadel (faces.size()*3 = ruudustiku kõigi kolmnurkade servade arv) on üks esinemissagedus 1 ja üks esinemine -1, samas kui vektoril b on null komponente. See tähendab, et panen meie kolmnurkse võrgu igale servale vedru: kõik servad püüavad saada sama tippu kui nende algus- ja lõpp-punkt.

    Veel kord: kõik tipud on muutujad ja nad ei saa oma algsest asukohast kaugele kõrvale kalduda, kuid samal ajal püüavad nad muutuda üksteisega sarnaseks.

    Siin on tulemus:

    Kõik oleks hästi, mudel on tõesti silutud, kuid see liikus oma esialgsest servast eemale. Muudame veidi koodi:

    For (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

    Meie maatriksis A serval olevate tippude jaoks ei lisa ma rida kategooriast v_i = verts[i][d], vaid 1000*v_i = 1000*verts[i][d]. Mida see muudab? Ja see muudab meie vea ruutkuju. Nüüd ei maksa üks kõrvalekalle ülemisest servast mitte ühe ühiku, nagu varem, vaid 1000 * 1000 ühikut. See tähendab, et äärmiste tippude külge riputasime tugevama vedru, lahendus eelistab teisi tugevamalt venitada. Siin on tulemus:

    Kahekordistame tippude vahel olevate vedrude tugevust:
    nlKoefitsient(nägu[ j ], 2); nlKoefitsient(nägu[(j+1)%3], -2);

    On loogiline, et pind on muutunud siledamaks:

    Ja nüüd isegi sada korda tugevam:

    Mis see on? Kujutage ette, et oleme kastnud traatrõnga seebivette. Selle tulemusena püüab saadud seebikile olla võimalikult väike kumerus, puudutades sama piiri - meie traatrõngast. Täpselt selle saimegi, kui kinnitasime piirde ja palusime seest sileda pinna. Õnnitleme, lahendasime just Laplace'i võrrandi Dirichlet' piirtingimustega. Kõlab lahedalt? Kuid tegelikult tuleb lahendada vaid üks lineaarvõrrandisüsteem.

    Poissoni võrrand

    Anname veel ühe laheda nime.

    Oletame, et mul on selline pilt:

    Kõik on tublid, aga mulle tool ei meeldi.

    Lõikasin pildi pooleks:



    Ja ma valin oma kätega tooli:

    Seejärel lohistan kõik, mis on maskis valge, pildi vasakusse serva ja samal ajal ütlen kogu pildi ulatuses, et kahe naaberpiksli vahe peaks olema võrdne kahe naaberpiksli vahega. parem pilt:

    For (int i=0; i

    Siin on tulemus:

    Kood ja pildid on olemas

    Mis leiab kõige laiemat rakendust erinevates teadus- ja praktikavaldkondades. See võib olla füüsika, keemia, bioloogia, majandus, sotsioloogia, psühholoogia ja nii edasi ja nii edasi. Saatuse tahtel pean sageli tegelema majandusega ja seetõttu korraldan täna teile pileti imelisse riiki nimega Ökonomeetria=) … Kuidas sa seda ei taha?! Seal on väga hea – sa pead lihtsalt otsustama! …Aga mida sa ilmselt kindlasti tahad, on õppida probleeme lahendama vähimruudud. Ja eriti usinad lugejad õpivad neid lahendama mitte ainult täpselt, vaid ka VÄGA KIIRESTI ;-) Aga enne probleemi üldine avaldus+ seotud näide:

    Laske uurida näitajaid mõnes ainevaldkonnas, millel on kvantitatiivne väljendus. Samas on põhjust arvata, et näitaja sõltub indikaatorist. See oletus võib olla nii teaduslik hüpotees kui ka põhineda elementaarsel tervel mõistusel. Jätame teaduse aga kõrvale ja uurime isuäratavamaid valdkondi – nimelt toidupoode. Tähistage:

    – toidupoe kaubanduspind, ruutmeetrit,
    - toidupoe aastakäive, miljonit rubla.

    On täiesti selge, et mida suurem on kaupluse pindala, seda suurem on enamikul juhtudel selle käive.

    Oletame, et pärast vaatluste / katsete / arvutuste / tamburiiniga tantsimist on meie käsutuses numbrilised andmed:

    Toidupoodidega on minu arvates kõik selge: - see on 1. poe pindala, - selle aastakäive, - 2. kaupluse pind, - selle aastakäive jne. Muide, salastatud materjalidele ligipääs pole üldse vajalik – üsna täpse hinnangu käibele saab kasutades matemaatiline statistika. Kuid ärge laske end segada, kommertsspionaaži kursus on juba tasutud =)

    Tabeliandmeid saab kirjutada ka punktide kujul ja kujutada meile tavapärasel viisil. Descartes'i süsteem .

    Vastame olulisele küsimusele: mitu punkti on vaja kvalitatiivse uuringu jaoks?

    Mida suurem, seda parem. Minimaalne lubatud komplekt koosneb 5-6 punktist. Lisaks ei tohiks väikese andmehulga korral valimisse kaasata "ebanormaalseid" tulemusi. Nii võib näiteks väike eliitpood aidata suurusjärgus rohkem kui “oma kolleegid”, moonutades seeläbi üldist mustrit, mis tuleb leida!

    Kui see on üsna lihtne, peame valima funktsiooni, ajakava mis läbib punktidele võimalikult lähedalt . Sellist funktsiooni nimetatakse ligikaudne (ligikaudne – ligikaudne) või teoreetiline funktsioon . Üldiselt ilmub siin kohe ilmne "teeskleja" - kõrge astme polünoom, mille graafik läbib KÕIKI punkte. Kuid see valik on keeruline ja sageli lihtsalt vale. (kuna diagramm "tuuleb" kogu aeg ja kajastab halvasti peamist trendi).

    Seega peab soovitud funktsioon olema piisavalt lihtne ja samas peegeldama adekvaatselt sõltuvust. Nagu võite arvata, nimetatakse ühte selliste funktsioonide leidmise meetoditest vähimruudud. Esiteks analüüsime selle olemust üldiselt. Olgu mõni funktsioon katseandmetele ligikaudne:


    Kuidas hinnata selle lähenduse täpsust? Arvutagem välja ka eksperimentaalsete ja funktsionaalsete väärtuste erinevused (hälbed). (uurime joonist). Esimene mõte, mis pähe tuleb, on hinnata, kui suur summa on, kuid probleem on selles, et erinevused võivad olla negatiivsed. (näiteks, ) ja sellisest summeerimisest tulenevad kõrvalekalded tühistavad üksteist. Seetõttu soovitab see lähenemise täpsuse hinnanguna võtta summa moodulid kõrvalekalded:

    või volditud kujul: (äkki, kes ei tea: on summa ikoon ja abimuutuja - "loendur", mis võtab väärtused vahemikus 1 kuni ).

    Lähendades katsepunkte erinevate funktsioonidega, saame erinevad väärtused ja on ilmne, et kus see summa on väiksem, on see funktsioon täpsem.

    Selline meetod on olemas ja seda nimetatakse vähima mooduli meetod. Praktikas on see aga palju laiemalt levinud. vähima ruudu meetod, kus võimalikud negatiivsed väärtused ei välistata mitte mooduli, vaid hälvete ruudustamisel:

    , misjärel suunatakse jõupingutused sellise funktsiooni valikule, et hälvete ruudu summa oli võimalikult väike. Tegelikult sellest ka meetodi nimi.

    Ja nüüd pöördume tagasi teise olulise punkti juurde: nagu eespool märgitud, peaks valitud funktsioon olema üsna lihtne - kuid selliseid funktsioone on ka palju: lineaarne , hüperboolne, eksponentsiaalne, logaritmiline, ruutkeskne jne. Ja loomulikult tahaks siinkohal kohe "tegevusvaldkonda vähendada". Millist funktsioonide klassi uuringuks valida? Primitiivne, kuid tõhus tehnika:

    - Lihtsaim viis punktide tõmbamiseks joonisel ja analüüsida nende asukohta. Kui need kipuvad olema sirgjoonelised, siis peaksite otsima sirgjoone võrrand optimaalsete väärtustega ja . Ehk siis ülesandeks on leida SELLISED koefitsiendid – et hälvete ruudu summa oleks kõige väiksem.

    Kui punktid asuvad näiteks mööda hüperbool, siis on selge, et lineaarfunktsioon annab halva lähenduse. Sel juhul otsime hüperboolvõrrandi jaoks kõige soodsamaid koefitsiente - need, mis annavad minimaalse ruutude summa .

    Nüüd pange tähele, et mõlemal juhul räägime kahe muutuja funktsioonid, kelle argumendid on otsis sõltuvuse valikuid:

    Ja sisuliselt peame lahendama standardprobleemi – leidma vähemalt kahe muutuja funktsioon.

    Tuletage meelde meie näidet: oletagem, et "poe" punktid kipuvad asuma sirgjooneliselt ja on põhjust uskuda nende olemasolu lineaarne sõltuvus käive kauplemispiirkonnast. Leiame SELLISED koefitsiendid "a" ja "olla", et hälvete ruudu summa oli väikseim. Kõik nagu tavaliselt – kõigepealt I järgu osatuletised. Vastavalt lineaarsuse reegel saate vahet teha otse summaikooni all:

    Kui soovite seda teavet kasutada essee või kursusetöö jaoks, olen allikate loendis oleva lingi eest väga tänulik, nii üksikasjalikke arvutusi ei leia kuskil:

    Teeme standardse süsteemi:

    Vähendame iga võrrandit "kahega" ja lisaks "lõhkume" summad:

    Märge : analüüsige iseseisvalt, miks "a" ja "be" saab summaikoonist välja võtta. Muide, formaalselt saab seda teha summaga

    Kirjutame süsteemi ümber "rakendatud" kujul:

    mille järel hakatakse koostama meie probleemi lahendamise algoritmi:

    Kas me teame punktide koordinaate? Me teame. Summad kas leiame? Kergesti. Koostame kõige lihtsama kahe tundmatuga lineaarvõrrandi süsteem("a" ja "beh"). Lahendame süsteemi nt Crameri meetod, mille tulemuseks on statsionaarne punkt . Kontrollimine ekstreemumi jaoks piisav tingimus, saame kontrollida, et siinkohal on funktsioon ulatub täpselt miinimum. Kontrollimine on seotud täiendavate arvutustega ja seetõttu jätame selle kulisside taha. (vajadusel saab puuduvat kaadrit vaadata). Teeme lõpliku järelduse:

    Funktsioon parim viis (vähemalt võrreldes kõigi teiste lineaarsete funktsioonidega) toob katsepunktid lähemale . Jämedalt öeldes läbib selle graafik nendele punktidele võimalikult lähedalt. Traditsiooni järgi ökonomeetria nimetatakse ka saadud lähendusfunktsiooni paaris lineaarse regressiooni võrrand .

    Vaadeldav probleem on väga praktilise tähtsusega. Meie näite olukorras võrrand võimaldab ennustada, millist käivet ("yig") on poes ühe või teise müügipinna väärtusega ("x" üks või teine ​​tähendus). Jah, saadud prognoos on vaid prognoos, kuid paljudel juhtudel osutub see üsna täpseks.

    Analüüsin ainult ühte probleemi "päris" numbritega, kuna selles pole raskusi - kõik arvutused on 7.-8. klassis kooli õppekava tasemel. 95 protsendil juhtudest palutakse teil leida lihtsalt lineaarne funktsioon, kuid artikli lõpus näitan, et optimaalse hüperbooli, astendaja ja mõne muu funktsiooni võrrandite leidmine pole enam keeruline.

    Tegelikult jääb üle lubatud maiuspalade levitamine - nii et õpiksite selliseid näiteid mitte ainult täpselt, vaid ka kiiresti lahendama. Uurime hoolikalt standardit:

    Ülesanne

    Kahe näitaja vahelise seose uurimise tulemusena saadi järgmised numbripaarid:

    Vähimruutude meetodil leidke lineaarfunktsioon, mis kõige paremini lähendab empiirilist väärtust (kogenud) andmeid. Koostage joonis, millele joonistage Descartes'i ristkülikukujulises koordinaatsüsteemis katsepunktid ja lähendusfunktsiooni graafik . Leidke empiiriliste ja teoreetiliste väärtuste vaheliste hälvete ruudu summa. Uurige, kas funktsioon on parem (vähimruutude meetodil) ligikaudsed katsepunktid.

    Pange tähele, et "x" väärtused on loomulikud väärtused ja sellel on iseloomulik tähenduslik tähendus, millest räägin veidi hiljem; kuid need võivad muidugi olla murdosa. Lisaks võivad nii "X" kui ka "G" väärtused olenevalt konkreetse ülesande sisust olla täielikult või osaliselt negatiivsed. Noh, meile on antud "näotu" ülesanne ja me alustame sellega lahendus:

    Süsteemi lahendusena leiame optimaalse funktsiooni koefitsiendid:

    Kompaktsema tähistuse huvides võib muutuja “loendur” ära jätta, kuna on juba selge, et summeerimine toimub vahemikus 1 kuni .

    Vajalikud summad on mugavam arvutada tabeli kujul:


    Arvutamist saab teha mikrokalkulaatoriga, kuid palju parem on kasutada Excelit - nii kiiremini kui ka vigadeta; vaadake lühikest videot:

    Seega saame järgmise süsteem:

    Siin saate korrutada teise võrrandi 3-ga ja lahutage 1. võrrandist liige liikme haaval 2.. Kuid see on õnn - praktikas pole süsteemid sageli andekad ja sellistel juhtudel säästab see Crameri meetod:
    , seega on süsteemil ainulaadne lahendus.

    Teeme kontrolli. Ma saan aru, et ma ei taha, aga miks jätta vahele vigu, kus neist ei saa mööda minna? Asendage leitud lahendus iga süsteemi võrrandi vasakpoolsesse serva:

    Vastavate võrrandite õiged osad saadakse, mis tähendab, et süsteem on õigesti lahendatud.

    Seega soovitud ligikaudne funktsioon: – alates kõik lineaarsed funktsioonid katseandmed on selle järgi kõige paremini ligikaudsed.

    Erinevalt sirge kaupluse käibe sõltuvus oma pindalast, leitud sõltuvus on tagurpidi (põhimõte "mida rohkem - seda vähem"), ja selle fakti paljastab kohe negatiivne nurga koefitsient. Funktsioon teatab meile, et teatud näitaja suurenemisel 1 ühiku võrra väheneb sõltuva näitaja väärtus keskmine 0,65 ühiku võrra. Nagu öeldakse, mida kõrgem on tatra hind, seda vähem müüakse.

    Ligikaudse funktsiooni joonistamiseks leiame kaks selle väärtust:

    ja teostage joonis:


    Ehitatud rida nimetatakse trendijoon (nimelt lineaarne trendijoon, st üldiselt ei pruugi trend olla sirgjoon). Kõik on tuttavad väljendiga "trendis olema" ja ma arvan, et see termin ei vaja täiendavaid kommentaare.

    Arvutage kõrvalekallete ruudu summa empiiriliste ja teoreetiliste väärtuste vahel. Geomeetriliselt on see "karmiinpunaste" segmentide pikkuste ruutude summa (neist kaks on nii väikesed, et ei näe neid isegi).

    Võtame arvutused kokku tabelis:


    Neid saab jälle käsitsi läbi viia, igaks juhuks toon näite 1. punkti kohta:

    kuid palju tõhusam on teha juba tuntud viis:

    Kordame: mis on tulemuse tähendus? Alates kõik lineaarsed funktsioonid funktsiooni eksponent on väikseim, see tähendab, et see on oma perekonna parim lähendus. Ja siin, muide, pole probleemi viimane küsimus juhuslik: mis siis, kui pakutud eksponentsiaalne funktsioon kas katsepunkte on parem lähendada?

    Leiame vastava hälbete ruudusumma - nende eristamiseks tähistan need tähega "epsilon". Tehnika on täpselt sama:


    Ja veelkord iga 1. punkti tulearvestuse kohta:

    Excelis kasutame standardfunktsiooni EXP (Süntaksi leiate Exceli spikrist).

    Järeldus: , seega lähendab eksponentsiaalfunktsioon katsepunkte halvemini kui sirgjoon .

    Kuid siin tuleb märkida, et "hullem" on ei tähenda veel, Mis on valesti. Nüüd koostasin selle eksponentsiaalfunktsiooni graafiku – ja see läbib ka punktide lähedalt - nii palju, et ilma analüütilise uuringuta on raske öelda, milline funktsioon on täpsem.

    See lõpetab lahenduse ja ma pöördun tagasi argumendi loodusväärtuste küsimuse juurde. Erinevates uuringutes on reeglina majanduslikud või sotsioloogilised kuud, aastad või muud võrdsed ajavahemikud nummerdatud loomuliku "X-iga". Mõelge näiteks sellisele probleemile.

    Vähimruudud on matemaatiline protseduur lineaarvõrrandi koostamiseks, mis sobib kõige paremini järjestatud paaride komplektiga, leides a ja b väärtused, koefitsiendid sirgjoonelisest võrrandist. Vähimruutude meetodi eesmärk on minimeerida y ja ŷ väärtuste ruudu koguviga. Kui iga punkti jaoks määrame vea ŷ, minimeerib vähimruutude meetod:

    kus n = järjestatud paaride arv ümber joone. andmete jaoks kõige asjakohasemad.

    Seda kontseptsiooni illustreerib joonis

    Joonise järgi otsustades minimeerib andmetega kõige paremini sobiv joon, regressioonisirge, graafiku nelja punkti ruudu koguvea. Järgmises näites näitan teile, kuidas seda vähimruutude meetodi abil kindlaks teha.

    Kujutage ette noorpaari, kes elavad hiljuti koos ja jagavad vannitoa tualettlauda. Noormees hakkas märkama, et pool tema toidulauda kahaneb vääramatult, kaotades oma koha juuksevahule ja sojakompleksidele. Viimastel kuudel on tüüp tähelepanelikult jälginud, kuidas tema lauaosas olevate esemete arv kasvab. Allolev tabel näitab, kui palju esemeid tüdrukul vannitoa laual on, mis on viimase paari kuu jooksul kogunenud.

    Kuna meie eesmärk on välja selgitada, kas üksuste arv aja jooksul suureneb, on sõltumatu muutuja "Kuu" ja sõltuv muutuja "Kaubade arv".

    Vähimruutude meetodi abil määrame andmetega kõige paremini sobiva võrrandi, arvutades y-teljel oleva lõigu a väärtused ja joone kalde b väärtused:

    a = y cf - bx vrd

    kus x cf on sõltumatu muutuja x keskmine väärtus, y cf on sõltumatu muutuja y keskmine väärtus.

    Allolev tabel võtab kokku nende võrrandite jaoks vajalikud arvutused.

    Meie vanni näite efektikõver oleks antud järgmise võrrandiga:

    Kuna meie võrrandi positiivne kalle on 0,976, on mehel tõend, et esemete arv laual kasvab aja jooksul keskmiselt 1 eseme võrra kuus. Graafik näitab efektikõverat järjestatud paaridega.

    Järgmise poolaasta (16. kuu) eeldatav kaubaarv arvutatakse järgmiselt:

    ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 üksust

    Seega on meie kangelasel aeg midagi ette võtta.

    Funktsioon TREND Excelis

    Nagu võite arvata, on Excelil funktsioon väärtuse arvutamiseks vähimruutude meetod. Seda funktsiooni nimetatakse TRENDiks. Selle süntaks on järgmine:

    TREND (teadaolevad Y väärtused; teadaolevad X väärtused; uued X väärtused; const)

    Y teadaolevad väärtused - sõltuvate muutujate massiiv, meie puhul tabelis olevate üksuste arv

    X teadaolevad väärtused - sõltumatute muutujate massiiv, meie puhul on see kuu

    uued X väärtused – mille jaoks uued X (kuu) väärtused TREND funktsioon tagastab sõltuvate muutujate eeldatava väärtuse (üksuste arv)

    const - valikuline. Boole'i ​​väärtus, mis määrab, kas konstant b peab olema 0.

    Näiteks on joonisel funktsioon TREND, mida kasutatakse vannitoa laua eeldatava esemete arvu määramiseks 16. kuul.

    Vähimruutude meetod (LSM) võimaldab hinnata erinevaid suurusi, kasutades paljude juhuslikke vigu sisaldavate mõõtmiste tulemusi.

    Iseloomulik MNC

    Selle meetodi põhiidee seisneb selles, et ülesande lahenduse täpsuse kriteeriumiks peetakse vigade ruudu summat, mida püütakse minimeerida. Selle meetodi kasutamisel saab rakendada nii numbrilisi kui ka analüütilisi lähenemisviise.

    Eelkõige eeldab vähimruutude meetod numbrilise teostusena tundmatu juhusliku suuruse võimalikult paljude mõõtmiste tegemist. Veelgi enam, mida rohkem arvutusi, seda täpsem on lahendus. Sellel arvutuskomplektil (algandmetel) saadakse veel üks pakutud lahenduste komplekt, millest seejärel valitakse välja parim. Kui lahenduste hulk on parametriseeritud, taandatakse vähimruutude meetod parameetrite optimaalse väärtuse leidmiseks.

    Analüütilise lähenemisena LSM-i rakendamisele lähteandmete (mõõtmiste) ja pakutud lahenduste kogumi kohta on määratletud mõned (funktsionaalsed), mida saab väljendada valemiga, mis on saadud teatud hüpoteesina, mis vajab kinnitamist. Sel juhul taandatakse vähimruutude meetod selle funktsionaalsuse miinimumi leidmiseks algandmete ruuduvigade hulgast.

    Pange tähele, et mitte vead ise, vaid vigade ruudud. Miks? Fakt on see, et sageli on mõõtmiste kõrvalekalded täpsest väärtusest nii positiivsed kui ka negatiivsed. Keskmise määramisel võib lihtne liitmine viia hinnangu kvaliteedi kohta vale järelduseni, kuna positiivsete ja negatiivsete väärtuste vastastikune tühistamine vähendab mõõtmiskomplekti proovivõtuvõimsust. Ja sellest tulenevalt ka hinnangu täpsus.

    Et seda ei juhtuks, summeeritakse kõrvalekalded ruudus. Veelgi enam, mõõdetud väärtuse ja lõpliku hinnangu mõõtmete võrdsustamiseks kasutatakse väljavõtmiseks vigade ruudu summat.

    Mõned MNC-de rakendused

    MNC-d kasutatakse laialdaselt erinevates valdkondades. Näiteks tõenäosusteoorias ja matemaatilises statistikas kasutatakse seda meetodit juhusliku suuruse sellise tunnuse määramiseks nagu standardhälve, mis määrab juhusliku suuruse väärtusvahemiku laiuse.

    Vähima ruudu meetod kasutatakse regressioonivõrrandi parameetrite hindamiseks.
    Ridade arv (algandmed)

    Üks tunnustevaheliste stohhastiliste seoste uurimise meetodeid on regressioonanalüüs.
    Regressioonanalüüs on regressioonivõrrandi tuletamine, mida kasutatakse juhusliku suuruse (tunnuse-tulemuse) keskmise väärtuse leidmiseks, kui on teada mõne teise (või mõne muu) muutuja (tunnuse-teguri) väärtus. See sisaldab järgmisi samme.

    1. seose vormi valik (analüütilise regressioonivõrrandi tüüp);
    2. võrrandi parameetrite hindamine;
    3. analüütilise regressioonivõrrandi kvaliteedi hindamine.
    Kõige sagedamini kasutatakse tunnuste statistilise seose kirjeldamiseks lineaarset vormi. Lineaarsele seosele tähelepanu pööramine on seletatav selle parameetrite selge majandusliku tõlgendusega, mis on piiratud muutujate varieerumisega, ja asjaoluga, et enamasti teisendatakse seose mittelineaarsed vormid (logaritmi võtmise või muutujate muutmisega) lineaarsele kujule arvutuste tegemiseks.
    Lineaarse paarisuhte korral on regressioonivõrrand järgmine: y i =a+b·x i +u i . Selle võrrandi a ja b parameetrid on hinnatud statistilise vaatluse x ja y andmete põhjal. Sellise hindamise tulemuseks on võrrand: , kus , - parameetrite a ja b hinnangud, - regressioonivõrrandiga saadud efektiivse tunnuse (muutuja) väärtus (arvutuslik väärtus).

    Parameetrite hindamiseks kasutatakse kõige sagedamini vähimruutude meetod (LSM).
    Vähimruutude meetod annab regressioonivõrrandi parameetrite parimad (järjekindlad, tõhusad ja erapooletud) hinnangud. Kuid ainult juhul, kui teatud eeldused juhusliku liikme (u) ja sõltumatu muutuja (x) kohta on täidetud (vt OLS-i eeldusi).

    Lineaarpaarvõrrandi parameetrite hindamise ülesanne vähimruutude meetodil koosneb järgmisest: selliste parameetrite hinnangute saamiseks , mille puhul efektiivse tunnuse tegelike väärtuste y i ruutude kõrvalekallete summa arvutatud väärtustest on minimaalne.
    Formaalselt OLS-i kriteerium võib kirjutada nii: .

    Vähimruutude meetodite klassifikatsioon

    1. Vähima ruudu meetod.
    2. Maksimaalse tõenäosuse meetod (tavalise klassikalise lineaarse regressioonimudeli puhul eeldatakse regressioonijääkide normaalsust).
    3. GLSM-i üldistatud vähimruutude meetodit kasutatakse vea autokorrelatsiooni ja heteroskedastilisuse korral.
    4. Kaalutud vähimruutude meetod (GLSM-i erijuhtum heteroskedastiliste jääkidega).

    Illustreerige olemust klassikaline vähimruutude meetod graafiliselt. Selleks koostame punktdiagrammi vastavalt vaatlusandmetele (x i , y i , i=1;n) ristkülikukujulises koordinaatsüsteemis (sellist punktgraafikut nimetatakse korrelatsiooniväljaks). Proovime leida sirge, mis on korrelatsioonivälja punktidele kõige lähemal. Vähimruutude meetodi järgi valitakse joon nii, et korrelatsioonivälja punktide ja selle sirge vahelise ruuduga vertikaalsete kauguste summa oleks minimaalne.

    Selle probleemi matemaatiline tähistus: .
    Väärtused y i ja x i =1...n on meile teada, need on vaatlusandmed. Funktsioonis S on need konstandid. Selle funktsiooni muutujad on parameetrite nõutavad hinnangud - , . 2 muutuja funktsiooni miinimumi leidmiseks on vaja arvutada selle funktsiooni osatuletised iga parameetri suhtes ja võrdsustada need nulliga, s.t. .
    Selle tulemusel saame kahe normaalse lineaarvõrrandi süsteemi:
    Selle süsteemi lahendamisel leiame vajalikud parameetrite hinnangud:

    Regressioonivõrrandi parameetrite arvutamise õigsust saab kontrollida summade võrdlemisel (arvutuste ümardamise tõttu on võimalik mõningane ebakõla).
    Parameetrite hinnangute arvutamiseks saate koostada tabeli 1.
    Regressioonikordaja b märk näitab seose suunda (kui b > 0 on seos otsene, kui b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
    Formaalselt on parameetri a väärtus y keskmine väärtus x puhul, mis võrdub nulliga. Kui märgiteguril ei ole ega saa olla nullväärtust, siis pole parameetri a ülaltoodud tõlgendusel mõtet.

    Tunnustevahelise seose tiheduse hindamine tehakse lineaarse paari korrelatsiooni koefitsiendiga - r x,y . Seda saab arvutada järgmise valemi abil: . Lisaks saab lineaarse paari korrelatsiooni koefitsiendi määrata regressioonikordaja b kaudu: .
    Paari korrelatsiooni lineaarse koefitsiendi lubatud väärtuste vahemik on –1 kuni +1. Korrelatsioonikordaja märk näitab seose suunda. Kui r x, y >0, siis on ühendus otsene; kui r x, y<0, то связь обратная.
    Kui see koefitsient on moodulis ühtsuse lähedane, siis võib tunnuste vahelist seost tõlgendada üsna tiheda lineaarsena. Kui selle moodul on võrdne ühega ê r x , y ê =1, siis on tunnuste vaheline seos funktsionaalne lineaarne. Kui tunnused x ja y on lineaarselt sõltumatud, siis r x,y on nullilähedane.
    Tabelit 1 saab kasutada ka r x,y arvutamiseks.

    Tabel 1

    N tähelepanekutx iy ix i ∙ y i
    1 x 1y 1x 1 a 1
    2 x2y2x 2 a 2
    ...
    nx ny nx n y n
    Veeru summa∑x∑a∑x y
    Tähendab
    Saadud regressioonivõrrandi kvaliteedi hindamiseks arvutatakse teoreetiline määramiskordaja - R 2 yx:

    ,
    kus d 2 on regressioonivõrrandiga seletatav dispersioon y;
    e 2 - jääk (regressioonivõrrandiga seletamatu) dispersioon y ;
    s 2 y - kogu (kogu) dispersioon y .
    Determinantkoefitsient iseloomustab regressiooniga (ja järelikult faktoriga x) seletatava tulemuseks oleva tunnuse y variatsiooni (dispersiooni) osakaalu koguvariatsioonis (dispersioonis) y. Määramiskoefitsient R 2 yx võtab väärtused vahemikus 0 kuni 1. Vastavalt sellele iseloomustab väärtus 1-R 2 yx dispersiooni y osakaalu, mis on põhjustatud muude mudelis arvestamata tegurite mõjust ja spetsifikatsioonivigadest.
    Paaritud lineaarse regressiooniga R 2 yx =r 2 yx .

    Seotud väljaanded