Pienimmän neliösumman menetelmä esimerkkejä ongelmanratkaisusta. Kokeellisten tietojen likimääräisyys

  • Ohjelmointi
    • opetusohjelma

    Johdanto

    Olen tietokoneohjelmoija. Tein urani suurimman harppauksen, kun opin sanomaan: "En ymmärrä mitään!" Nyt en häpeä kertoa tieteen valoisalle, että hän pitää minulle luennon, etten ymmärrä, mistä se, luminary, puhuu minulle. Ja se on erittäin vaikeaa. Kyllä, on vaikeaa ja noloa myöntää, ettet tiedä. Kuka haluaa myöntää, että hän ei tiedä perusasiat jostakin - siellä. Ammattini vuoksi joudun osallistumaan suureen määrään esitelmiä ja luentoja, joissa, myönnän, suurimmassa osassa tapauksia tunnen oloni uniseksi, koska en ymmärrä mitään. Ja en ymmärrä, koska tieteen nykytilanteen valtava ongelma on matematiikassa. Siinä oletetaan, että kaikki opiskelijat tuntevat ehdottomasti kaikki matematiikan osa-alueet (mikä on absurdia). On sääli myöntää, että et tiedä mikä johdannainen on (että tämä on vähän myöhemmin).

    Mutta olen oppinut sanomaan, etten tiedä mitä kertolasku on. Kyllä, en tiedä mikä alialgebra lie-algebran yläpuolella on. Kyllä, en tiedä miksi toisen asteen yhtälöitä tarvitaan elämässä. Muuten, jos olet varma, että tiedät, meillä on jotain puhuttavaa! Matematiikka on sarja temppuja. Matemaatikot yrittävät hämmentää ja pelotella yleisöä; missä ei ole hämmennystä, ei mainetta, ei auktoriteettia. Kyllä, on arvovaltaa puhua mahdollisimman abstraktia kieltä, mikä on sinänsä täyttä hölynpölyä.

    Tiedätkö mikä on johdannainen? Todennäköisesti kerrot minulle erosuhteen rajasta. Ensimmäisenä vuonna matematiikan Pietarin valtionyliopistossa Viktor Petrovich Khavin minua määritelty derivaatta funktion Taylor-sarjan ensimmäisen termin kertoimena pisteessä (se oli erillinen voimistelu Taylor-sarjan määrittämiseksi ilman derivaattoja). Nauroin tälle määritelmälle pitkään, kunnes vihdoin ymmärsin, mistä siinä oli kyse. Derivaata ei ole muuta kuin vain mitta siitä, kuinka paljon eriyttämämme funktio on samanlainen kuin funktio y=x, y=x^2, y=x^3.

    Minulla on nyt kunnia luennoida opiskelijoille, jotka pelko matematiikka. Jos pelkäät matematiikkaa - olemme matkalla. Heti kun yrität lukea tekstiä ja sinusta tuntuu, että se on liian monimutkaista, tiedä, että se on kirjoitettu huonosti. Väitän, ettei ole olemassa yhtä matematiikan aluetta, josta ei voida puhua "sormilla" menettämättä tarkkuutta.

    Haaste lähitulevaisuudelle: Opastin oppilaitani ymmärtämään, mitä lineaari-neliöohjain on. Älä ole ujo, tuhlaa kolme minuuttia elämästäsi, seuraa linkkiä. Jos et ymmärrä mitään, olemme matkalla. Minä (ammattimainen matemaatikko-ohjelmoija) en myöskään ymmärtänyt mitään. Ja voin vakuuttaa teille, että tämä voidaan selvittää "sormilla". Tällä hetkellä en tiedä, mikä se on, mutta vakuutan, että voimme selvittää sen.

    Joten ensimmäinen luento, jonka aion pitää opiskelijoilleni sen jälkeen, kun he juoksevat luokseni kauhuissaan sanoen, että lineaari-neliöohjain on kauhea bugi, jota et koskaan hallitse elämässäsi. pienimmän neliösumman menetelmät. Osaatko ratkaista lineaarisia yhtälöitä? Jos luet tätä tekstiä, luultavasti et.

    Joten kun on annettu kaksi pistettä (x0, y0), (x1, y1), esimerkiksi (1,1) ja (3,2), tehtävänä on löytää näiden kahden pisteen kautta kulkevan suoran yhtälö:

    kuva

    Tällä suoralla pitäisi olla seuraavanlainen yhtälö:

    Tässä alfa ja beta ovat meille tuntemattomia, mutta kaksi pistettä tästä viivasta tunnetaan:

    Voit kirjoittaa tämän yhtälön matriisimuodossa:

    Tässä meidän pitäisi tehdä lyyrinen poikkeama: mikä on matriisi? Matriisi ei ole muuta kuin kaksiulotteinen taulukko. Tämä on tapa tallentaa tietoja, sille ei pidä antaa enempää arvoja. On meistä itsestämme kiinni, kuinka tarkkaan tulkitaan tietty matriisi. Ajoittain tulkitsen sen lineaarisena mappauksena, ajoittain neliömuotona ja joskus yksinkertaisesti vektoreiden joukona. Tämä kaikki selvitetään kontekstissa.

    Korvataan tietyt matriisit niiden symbolisella esityksellä:

    Sitten (alfa, beta) löytyy helposti:

    Tarkemmin aiemmista tiedoistamme:

    Mikä johtaa seuraavaan yhtälöön pisteiden (1,1) ja (3,2) kautta kulkevasta suorasta:

    Okei, kaikki on selvää täällä. Ja etsitään läpi kulkevan suoran yhtälö kolme pisteet: (x0,y0), (x1,y1) ja (x2,y2):

    Voi-o-oi, mutta meillä on kolme yhtälöä kahdelle tuntemattomalle! Tavallinen matemaatikko sanoo, ettei ratkaisua ole. Mitä ohjelmoija sanoo? Ja hän kirjoittaa ensin uudelleen edellisen yhtälöjärjestelmän seuraavassa muodossa:

    Tässä tapauksessa vektorit i, j, b ovat kolmiulotteisia, joten (yleisessä tapauksessa) tälle järjestelmälle ei ole ratkaisua. Mikä tahansa vektori (alpha\*i + beta\*j) on vektorien (i, j) kattamassa tasossa. Jos b ei kuulu tähän tasoon, ratkaisua ei ole (yhtälön tasa-arvoa ei voida saavuttaa). Mitä tehdä? Etsitään kompromissia. Merkitään e (alfa, beta) kuinka emme saavuttaneet tasa-arvoa:

    Ja yritämme minimoida tämän virheen:

    Miksi neliö?

    Emme etsi vain normin minimiä, vaan normin neliön minimiä. Miksi? Itse minimipiste osuu yhteen ja neliö antaa tasaisen funktion (argumenttien neliöfunktio (alfa,beta)), kun taas pelkkä pituus antaa kartion muodossa olevan funktion, joka ei erotu minimipisteessä. Brr. Neliö on kätevämpi.

    Ilmeisesti virhe on minimoitu, kun vektori e kohtisuorassa vektorien kattamaa tasoa vastaan i ja j.

    Kuva

    Toisin sanoen: etsimme suoraa, jossa kaikkien pisteiden ja tämän suoran välisten etäisyyksien neliöityjen pituuksien summa on minimaalinen:

    PÄIVITYS: tässä minulla on jamb, etäisyys linjaan tulee mitata pystysuorassa, ei ortografisessa projektiossa. kommentoija on oikeassa.

    Kuva

    Täysin eri sanoin (huolellisesti, huonosti muotoiltu, mutta sen pitäisi olla selvää sormilla): otamme kaikki mahdolliset viivat kaikkien pisteparien välillä ja etsimme keskimääräistä viivaa kaikkien välillä:

    Kuva

    Toinen selitys sormissa: kiinnitämme jousen kaikkien datapisteiden (tässä niitä on kolme) ja etsimämme viivan väliin, ja tasapainotilan viiva on juuri se, mitä etsimme.

    Minimi neliömuoto

    Joten vektorin perusteella b ja taso, joka ulottuu matriisin sarakkeet-vektorit A(tässä tapauksessa (x0,x1,x2) ja (1,1,1)), etsimme vektoria e jonka pituus on vähintään neliö. Ilmeisesti minimi on saavutettavissa vain vektorille e, kohtisuorassa matriisin sarakkeet-vektorien kattamaa tasoa vastaan A:

    Toisin sanoen etsimme vektoria x=(alfa, beta), joka on:

    Muistutan, että tämä vektori x=(alfa, beta) on neliöfunktion ||e(alfa, beta)||^2 minimi:

    Tässä on hyödyllistä muistaa, että matriisi voidaan tulkita yhtä hyvin kuin neliömuoto, esimerkiksi identiteettimatriisi ((1,0),(0,1)) voidaan tulkita x^2 + y:n funktiona. ^2:

    neliömuoto

    Kaikki tämä voimistelu tunnetaan lineaarisena regressiona.

    Laplacen yhtälö Dirichlet-rajaehdon kanssa

    Nyt yksinkertaisin todellinen ongelma: siellä on tietty kolmiomainen pinta, se on tasoitettava. Lataamme esimerkiksi kasvomallini:

    Alkuperäinen sitoumus on saatavilla. Ulkoisten riippuvuuksien minimoimiseksi otin ohjelmiston renderöijani koodin jo Habreen. Lineaarisen järjestelmän ratkaisemiseen käytän OpenNL:ää, se on loistava ratkaisu, mutta sen asentaminen on erittäin vaikeaa: sinun on kopioitava kaksi tiedostoa (.h + .c) projektikansioosi. Kaikki tasoitus tehdään seuraavalla koodilla:

    For (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = kasvot[i]; for (int j = 0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

    X-, Y- ja Z-koordinaatit ovat erotettavissa, tasoitan ne erikseen. Eli ratkaisen kolme lineaariyhtälöjärjestelmää, joissa kussakin on sama määrä muuttujia kuin mallini kärkien lukumäärä. Matriisin A ensimmäisellä n rivillä on vain yksi 1 riviä kohden, ja vektorin b ensimmäisillä n rivillä on alkuperäiset mallikoordinaatit. Eli sidon jousisidoksen uuden ja vanhan kärkiaseman väliin - uudet eivät saa olla liian kaukana vanhoista.

    Kaikilla matriisin A seuraavilla riveillä (faces.size()*3 = ruudukon kaikkien kolmioiden reunojen lukumäärä) on yksi esiintymä 1 ja yksi esiintyminen -1, kun taas vektorissa b on nolla vastakkaisia ​​komponentteja. Tämä tarkoittaa, että laitan jousen kolmioverkkomme jokaiseen reunaan: kaikki reunat yrittävät saada saman kärjen kuin niiden aloitus- ja loppupisteet.

    Jälleen kerran: kaikki kärjet ovat muuttujia, eivätkä ne voi poiketa kauas alkuperäisestä sijainnistaan, mutta samalla ne yrittävät tulla samankaltaisiksi.

    Tässä on tulos:

    Kaikki olisi hyvin, malli on todella tasoitettu, mutta se siirtyi pois alkuperäisestä reunastaan. Muutetaan koodia hieman:

    For (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

    Matriisissamme A reunassa oleville pisteille en lisää riviä luokasta v_i = verts[i][d], vaan 1000*v_i = 1000*verts[i][d]. Mitä se muuttaa? Ja tämä muuttaa virheen neliöllisen muotomme. Nyt yksittäinen poikkeama ylhäältä reunassa ei maksa yhtä yksikköä, kuten ennen, vaan 1000 * 1000 yksikköä. Eli ääripisteisiin ripustettiin vahvempi jousi, ratkaisu mieluummin venyttää muita voimakkaammin. Tässä on tulos:

    Kaksinkertaistetaan kärkien välisten jousien vahvuus:
    nlKerroin(face[ j ], 2); nlKerroin(kasvo[(j+1)%3], -2);

    On loogista, että pinnasta on tullut tasaisempi:

    Ja nyt jopa sata kertaa vahvempi:

    Mikä tämä on? Kuvittele, että olemme kastaneet lankarenkaan saippuaveteen. Tämän seurauksena tuloksena oleva saippuakalvo yrittää saada mahdollisimman vähän kaarevuutta koskettaen samaa reunaa - lankarengaamme. Juuri tämän saimme kiinnittämällä reunuksen ja pyytämällä sileää pintaa sisälle. Onnittelut, olemme juuri ratkaisseet Laplacen yhtälön Dirichlet-rajaehdoilla. Kuulostaa siistiltä? Mutta itse asiassa vain yksi lineaarinen yhtälöjärjestelmä ratkaistavaksi.

    Poissonin yhtälö

    Otetaan toinen kiva nimi.

    Oletetaan, että minulla on tällainen kuva:

    Kaikki ovat hyviä, mutta minä en pidä tuolista.

    Leikkasin kuvan puoliksi:



    Ja valitsen tuolin käsilläni:

    Vedän sitten kuvan vasempaan reunaan kaiken, mikä on maskissa valkoista ja sanon samalla läpi koko kuvan, että kahden vierekkäisen pikselin eron tulee olla yhtä suuri kuin kuvan kahden vierekkäisen pikselin ero. oikea kuva:

    For (int i=0; i

    Tässä on tulos:

    Koodi ja kuvat löytyy

    Jolla on laajin sovellus eri tieteen ja käytännön aloilla. Se voi olla fysiikka, kemia, biologia, taloustiede, sosiologia, psykologia ja niin edelleen ja niin edelleen. Kohtalon tahdosta joudun usein käsittelemään taloutta, ja siksi järjestän tänään sinulle lipun hämmästyttävään maahan nimeltä Ekonometria=) … Miten et halua sitä?! Siellä on erittäin hyvä - sinun on vain päätettävä! …Mutta mitä varmasti haluat, on oppia ratkaisemaan ongelmia pienimmän neliösumman. Ja erityisen ahkerat lukijat oppivat ratkaisemaan ne paitsi tarkasti, myös ERITTÄIN NOPEASTI ;-) Mutta ensin yleiskuvaus ongelmasta+ asiaan liittyvä esimerkki:

    Tutkitaanko indikaattoreita jollain aihealueella, jolla on määrällinen ilmaisu. Samalla on täysi syy uskoa, että indikaattori riippuu indikaattorista. Tämä oletus voi olla sekä tieteellinen hypoteesi että perustaa terveeseen järkeen. Jätetään kuitenkin tiede sivuun ja tutkitaan herkullisempia alueita - nimittäin ruokakauppoja. Merkitse:

    – ruokakaupan liiketila, neliömetri,
    - päivittäistavarakaupan vuotuinen liikevaihto, miljoonaa ruplaa.

    On aivan selvää, että mitä suurempi myymälän pinta-ala, sitä suurempi on sen liikevaihto useimmissa tapauksissa.

    Oletetaan, että havaintojen / kokeiden / laskelmien / tamburiinin kanssa tanssimisen jälkeen meillä on käytettävissämme numeeriset tiedot:

    Ruokakaupoissa mielestäni kaikki on selvää: - tämä on 1. myymälän pinta-ala, - sen vuosiliikevaihto, - 2. myymälän pinta-ala, - sen vuosiliikevaihto jne. Muuten, turvaluokiteltuihin aineistoihin pääsy ei ole ollenkaan välttämätöntä - melko tarkka arvio liikevaihdosta voidaan saada käyttämällä matemaattiset tilastot. Älä kuitenkaan ole hajamielinen, kaupallisen vakoilun kurssi on jo maksettu =)

    Taulukkotiedot voidaan kirjoittaa myös pisteiden muodossa ja kuvata meille tavalliseen tapaan. Karteesinen järjestelmä .

    Vastataanpa tärkeään kysymykseen: kuinka monta pistettä tarvitaan laadulliseen tutkimukseen?

    Mitä isompi sen parempi. Pienin sallittu sarja koostuu 5-6 pisteestä. Lisäksi pienellä tietomäärällä "epänormaalia" tuloksia ei pitäisi sisällyttää otokseen. Joten esimerkiksi pieni eliittikauppa voi auttaa suuruusluokkaa enemmän kuin "kollegansa", mikä vääristää yleistä mallia, joka on löydettävä!

    Jos se on melko yksinkertaista, meidän on valittava funktio, ajoittaa joka kulkee mahdollisimman läheltä pisteitä . Tällaista funktiota kutsutaan likimääräinen (likiarvo - likiarvo) tai teoreettinen toiminto . Yleisesti ottaen tässä näkyy heti ilmeinen "teeskelija" - korkean asteen polynomi, jonka kaavio kulkee KAIKKI pisteet. Mutta tämä vaihtoehto on monimutkainen ja usein yksinkertaisesti väärä. (koska kaavio "tuulee" koko ajan ja heijastaa huonosti päätrendiä).

    Näin ollen halutun funktion tulee olla riittävän yksinkertainen ja samalla heijastaa riippuvuutta riittävästi. Kuten arvata saattaa, yksi tällaisten funktioiden löytämismenetelmistä on nimeltään pienimmän neliösumman. Analysoidaan ensin sen olemusta yleisellä tavalla. Olkoon jonkin funktion likimääräinen kokeellinen data:


    Kuinka arvioida tämän likiarvon tarkkuus? Lasketaan myös erot (poikkeamat) kokeellisten ja toiminnallisten arvojen välillä (tutkimme piirustusta). Ensimmäinen ajatus, joka tulee mieleen, on arvioida, kuinka suuri summa on, mutta ongelmana on, että erot voivat olla negatiivisia. (esimerkiksi, ) ja tällaisesta summauksesta johtuvat poikkeamat kumoavat toisensa. Siksi se ehdottaa itse ottavan summan arviona likiarvon tarkkuudesta moduulit poikkeamat:

    tai taitettuna: (yhtäkkiä, kuka ei tiedä: on summakuvake ja apumuuttuja - "laskuri", joka ottaa arvot välillä 1 - ).

    Lähentämällä koepisteitä eri funktioilla saamme erilaisia ​​arvoja, ja on selvää, että missä tämä summa on pienempi, funktio on tarkempi.

    Tällainen menetelmä on olemassa ja sitä kutsutaan pienimmän moduulin menetelmä. Käytännössä se on kuitenkin yleistynyt huomattavasti. pienimmän neliösumman menetelmä, jossa mahdollisia negatiivisia arvoja ei eliminoida moduulilla, vaan neliöimällä poikkeamat:

    , jonka jälkeen ponnistelut kohdistetaan sellaisen funktion valintaan, että neliöityjen poikkeamien summa oli mahdollisimman pieni. Itse asiassa, tästä menetelmän nimi.

    Ja nyt palaamme toiseen tärkeään kohtaan: kuten yllä todettiin, valitun toiminnon pitäisi olla melko yksinkertainen - mutta myös sellaisia ​​​​toimintoja on monia: lineaarinen , hyperbolinen, eksponentiaalinen, logaritminen, neliöllinen jne. Ja tietysti täällä haluaisin heti "vähentää toimintakenttää". Mikä funktioluokka valita tutkimukseen? Alkukantainen mutta tehokas tekniikka:

    - Helpoin tapa nostaa pisteitä piirustukseen ja analysoida niiden sijaintia. Jos ne ovat yleensä suorassa linjassa, sinun tulee etsiä suora yhtälö optimaalisilla arvoilla ja . Toisin sanoen tehtävänä on löytää SELLAISIA kertoimia - niin, että neliöityjen poikkeamien summa on pienin.

    Jos pisteet sijaitsevat esimerkiksi pitkin hyperbolia, silloin on selvää, että lineaarinen funktio antaa huonon approksimaation. Tässä tapauksessa etsimme "suotuisimpia" kertoimia hyperboliyhtälölle - ne, jotka antavat pienimmän neliösumman .

    Huomaa nyt, että molemmissa tapauksissa puhumme kahden muuttujan funktioita, jonka argumentit ovat etsii riippuvuusvaihtoehtoja:

    Ja pohjimmiltaan meidän on ratkaistava standardiongelma - löytää vähintään kahden muuttujan funktio.

    Muista esimerkkimme: oletetaan, että "myymälä"-pisteet sijaitsevat yleensä suorassa linjassa ja on täysi syy uskoa läsnäolo lineaarinen riippuvuus liikevaihtoa kauppa-alueelta. Etsitään SELLAISIA kertoimia "a" ja "olla" niin, että neliöpoikkeamien summa oli pienin. Kaikki tavalliseen tapaan - ensin ensimmäisen asteen osittaiset johdannaiset. Mukaan lineaarisuussääntö voit erotella suoraan summakuvakkeen alla:

    Jos haluat käyttää näitä tietoja esseessä tai lopputyössä, olen erittäin kiitollinen linkistä lähdeluettelossa, niin yksityiskohtaisia ​​laskelmia et löydä mistään:

    Tehdään vakiojärjestelmä:

    Vähennämme kutakin yhtälöä "kahdella" ja lisäksi "hajamme" summat:

    Merkintä : analysoi itsenäisesti, miksi "a" ja "be" voidaan poistaa summakuvakkeesta. Muuten, muodollisesti tämä voidaan tehdä summalla

    Kirjoitetaan järjestelmä uudelleen "soveltuun" muotoon:

    jonka jälkeen ongelmamme ratkaisun algoritmi alkaa piirtää:

    Tiedämmekö pisteiden koordinaatit? Me tiedämme. Summat voimmeko löytää? Helposti. Koostamme yksinkertaisimman kahden lineaarisen yhtälön järjestelmä, jossa on kaksi tuntematonta("a" ja "beh"). Ratkaisemme järjestelmän mm. Cramerin menetelmä, jolloin tuloksena on paikallaan oleva piste . Tarkistetaan riittävä kunto ääripäälle, voimme varmistaa, että tässä vaiheessa funktio tavoittaa tarkasti minimi. Vahvistamiseen liittyy lisälaskelmia, joten jätämme sen kulissien taakse. (tarvittaessa puuttuvaa kehystä voi katsoa). Teemme lopullisen johtopäätöksen:

    Toiminto paras tapa (ainakin verrattuna muihin lineaarisiin funktioihin) tuo koepisteitä lähemmäksi . Karkeasti ottaen sen kaavio kulkee mahdollisimman läheltä näitä pisteitä. Perinteessä ekonometria kutsutaan myös tuloksena olevaa approksimointifunktiota parillinen lineaarinen regressioyhtälö .

    Käsiteltävänä olevalla ongelmalla on suuri käytännön merkitys. Esimerkkimme tilanteessa yhtälö voit ennustaa millaista liikevaihtoa ("yig") tulee olemaan myymälässä jollakin myyntialueen arvolla (yksi tai toinen "x":n merkitys). Kyllä, tuloksena oleva ennuste on vain ennuste, mutta monissa tapauksissa se osoittautuu melko tarkkaksi.

    Analysoin vain yhden ongelman "oikeilla" numeroilla, koska siinä ei ole vaikeuksia - kaikki laskelmat ovat koulun opetussuunnitelman tasolla luokilla 7-8. 95 prosentissa tapauksista sinua pyydetään löytämään vain lineaarinen funktio, mutta aivan artikkelin lopussa osoitan, että optimaalisen hyperbelin, eksponentin ja joidenkin muiden funktioiden yhtälöiden löytäminen ei ole enää vaikeampaa.

    Itse asiassa on vielä jaettava luvatut herkut - jotta opit ratkaisemaan tällaiset esimerkit paitsi tarkasti, myös nopeasti. Tutkimme standardia huolellisesti:

    Tehtävä

    Kahden indikaattorin välisen suhteen tutkimisen tuloksena saatiin seuraavat numeroparit:

    Etsi pienimmän neliösumman menetelmällä lineaarinen funktio, joka parhaiten approksimoi empiiristä (kokenut) tiedot. Piirrä piirustus, jolle suorakulmaisessa suorakulmaisessa koordinaattijärjestelmässä piirrä kokeelliset pisteet ja kaavio approksimaatiofunktiosta . Laske empiiristen ja teoreettisten arvojen neliöityjen poikkeamien summa. Selvitä, onko toiminto parempi (pienimpien neliöiden menetelmällä) likimääräiset koepisteet.

    Huomaa, että "x"-arvot ovat luonnollisia arvoja, ja tällä on tyypillinen merkityksellinen merkitys, josta puhun hieman myöhemmin; mutta ne voivat tietysti olla murto-osia. Lisäksi tietyn tehtävän sisällöstä riippuen sekä "X"- että "G"-arvot voivat olla täysin tai osittain negatiivisia. No, meille on annettu "kasvoton" tehtävä, ja aloitamme sen ratkaisu:

    Löydämme optimaalisen funktion kertoimet ratkaisuksi järjestelmään:

    Pienemmän merkinnän vuoksi "laskuri"-muuttuja voidaan jättää pois, koska on jo selvää, että summaus suoritetaan 1 - .

    Tarvittavat määrät on helpompi laskea taulukkomuodossa:


    Laskelmat voidaan suorittaa mikrolaskimella, mutta on paljon parempi käyttää Exceliä - sekä nopeammin että ilman virheitä; katso lyhyt video:

    Siten saamme seuraavan järjestelmä:

    Täällä voit kertoa toisen yhtälön 3:lla ja vähennä 2. 1. yhtälöstä termi kerrallaan. Mutta tämä on onnea - käytännössä järjestelmät eivät usein ole lahjakkaita, ja sellaisissa tapauksissa se säästää Cramerin menetelmä:
    , joten järjestelmällä on ainutlaatuinen ratkaisu.

    Tehdään tarkistus. Ymmärrän, että en halua, mutta miksi ohittaa virheet, joita ei todellakaan voi missata? Korvaa löydetty ratkaisu järjestelmän kunkin yhtälön vasempaan reunaan:

    Vastaavien yhtälöiden oikeat osat saadaan, mikä tarkoittaa, että järjestelmä on ratkaistu oikein.

    Siten haluttu approksimoiva funktio: – alkaen kaikki lineaarifunktiot kokeellinen data on parhaiten arvioitu sen avulla.

    Toisin kuin suoraan myymälän liikevaihdon riippuvuus sen pinta-alasta, todettu riippuvuus on käänteinen (periaate "mitä enemmän - sitä vähemmän"), ja tämä tosiasia paljastuu välittömästi negatiivisesti kulmakerroin. Toiminto ilmoittaa meille, että kun tiettyä indikaattoria lisätään 1 yksiköllä, riippuvan indikaattorin arvo pienenee keskiverto 0,65 yksiköllä. Kuten sanotaan, mitä korkeampi tattari maksaa, sitä vähemmän myydään.

    Approksimoivan funktion piirtämiseksi löydämme kaksi sen arvoista:

    ja suorita piirustus:


    Rakennettua linjaa kutsutaan trendiviiva (eli lineaarinen trendiviiva, eli yleisessä tapauksessa trendi ei välttämättä ole suora). Kaikille on tuttu ilmaus "olla trendissä", eikä tämä termi mielestäni kaipaa lisäkommentteja.

    Laske poikkeamien neliösumma empiiristen ja teoreettisten arvojen välillä. Geometrisesti tämä on "purinpunaisten" segmenttien pituuksien neliöiden summa (joista kaksi on niin pieniä, ettet edes näe niitä).

    Tehdään laskelmat yhteenvetona taulukkoon:


    Ne voidaan jälleen suorittaa manuaalisesti, jos annan esimerkin 1. kohdasta:

    mutta paljon tehokkaampaa on tehdä jo tunnetulla tavalla:

    Toistetaan: mikä on tuloksen merkitys? From kaikki lineaarifunktiot toiminto eksponentti on pienin, eli se on perheensä paras approksimaatio. Ja tässä, muuten, ongelman viimeinen kysymys ei ole sattumaa: entä jos ehdotettu eksponentiaalinen funktio olisiko parempi arvioida koepisteitä?

    Etsitään vastaava neliöpoikkeamien summa - erottaakseni ne, merkitsen ne kirjaimella "epsilon". Tekniikka on täsmälleen sama:


    Ja jälleen jokaiselle palolaskelmalle 1. pisteelle:

    Excelissä käytämme vakiofunktiota EXP (Syntaksi löytyy Excelin ohjeesta).

    Johtopäätös: , joten eksponentiaalinen funktio approkimoi koepisteitä huonommin kuin suora .

    Mutta tässä on huomattava, että "huonompi" on ei tarkoita vielä, mikä hätänä. Nyt rakensin kaavion tästä eksponentiaalisesta funktiosta - ja se myös kulkee lähellä pisteitä - niin paljon, että ilman analyyttistä tutkimusta on vaikea sanoa, mikä funktio on tarkempi.

    Tämä täydentää ratkaisun, ja palaan kysymykseen väitteen luonnollisista arvoista. Erilaisissa tutkimuksissa yleensä taloudelliset tai sosiologiset, kuukaudet, vuodet tai muut vastaavat aikavälit on numeroitu luonnollisella "X":llä. Mieti esimerkiksi tällaista ongelmaa.

    Pienin neliösumma on matemaattinen menetelmä lineaarisen yhtälön muodostamiseksi, joka sopii parhaiten järjestetyille pareille etsimällä arvot a:lle ja b:lle, kertoimille suorassa yhtälössä. Pienimmän neliösumman menetelmän tavoitteena on minimoida y- ja ŷ-arvojen välinen kokonaisneliövirhe. Jos jokaiselle pisteelle määritetään virhe ŷ, pienimmän neliösumman menetelmä minimoi:

    missä n = järjestetyt parit rivin ympärillä. datan kannalta oleellisin.

    Tämä käsite on havainnollistettu kuvassa

    Kuvasta päätellen dataan parhaiten sopiva viiva, regressioviiva, minimoi kaavion neljän pisteen kokonaisneliövirheen. Näytän sinulle, kuinka tämä määritetään pienimmän neliösumman menetelmällä seuraavassa esimerkissä.

    Kuvittele nuori pari, joka asuu hiljattain yhdessä ja jakaa kylpyhuoneen meikkipöydän. Nuori mies alkoi huomata, että puolet hänen pöydästään kutistui väistämättä ja menetti jalansijaa hiusvaahdolle ja soijakomplekseille. Kaveri on viime kuukausina seurannut tarkasti, kuinka nopeasti tavaroiden määrä hänen osassaan pöydässä kasvaa. Alla olevasta taulukosta näet, kuinka monta tavaraa tytöllä on kylpyhuoneen pöydällä, joita on kertynyt viime kuukausina.

    Koska tavoitteemme on selvittää, kasvaako nimikkeiden määrä ajan myötä, "Kuukausi" on riippumaton muuttuja ja "Number of Items" on riippuvainen muuttuja.

    Pienimmän neliösumman menetelmällä määritämme tietoihin parhaiten sopivan yhtälön laskemalla a:n, y-akselin janan ja b:n, suoran kaltevuuden:

    a = y cf - bx cf

    missä x cf on riippumattoman muuttujan x:n keskiarvo, y cf on riippumattoman muuttujan y:n keskiarvo.

    Alla olevassa taulukossa on yhteenveto näitä yhtälöitä varten tarvittavista laskelmista.

    Kylpyammeesimerkkimme vaikutuskäyrä saadaan seuraavalla yhtälöllä:

    Koska yhtälöllämme on positiivinen kaltevuus 0,976, kaverilla on todisteita siitä, että pöydällä olevien esineiden määrä kasvaa ajan myötä keskimäärin 1 esine kuukaudessa. Kaavio näyttää vaikutuskäyrän järjestetyillä pareilla.

    Seuraavan puolivuotiskauden (kuukausi 16) odotettu tavaramäärä lasketaan seuraavasti:

    ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 kohdetta

    Joten sankarimme on aika ryhtyä toimiin.

    TREND-funktio Excelissä

    Kuten olet ehkä arvannut, Excelissä on funktio arvon laskemiseksi pienimmän neliösumman menetelmä. Tätä ominaisuutta kutsutaan TRENDiksi. Sen syntaksi on seuraava:

    TREND (tunnetut Y-arvot; tunnetut X-arvot; uudet X-arvot; const)

    Y:n tunnetut arvot - joukko riippuvia muuttujia, tässä tapauksessa taulukon kohteiden lukumäärä

    X:n tunnetut arvot - joukko riippumattomia muuttujia, meidän tapauksessamme se on kuukausi

    uudet X-arvot – joille uudet X (kuukausi)-arvot TREND-toiminto palauttaa riippuvien muuttujien odotusarvon (kohteiden lukumäärä)

    const - valinnainen. Boolen arvo, joka määrittää, onko vakion b oltava 0.

    Kuvassa on esimerkiksi TREND-toiminto, jolla määritetään kylpyhuoneen pöydällä olevien tavaroiden odotettu määrä 16. kuukaudeksi.

    Pienimmän neliösumman menetelmällä (LSM) voit arvioida erilaisia ​​suureita käyttämällä useiden satunnaisvirheitä sisältävien mittausten tuloksia.

    Tyypillinen MNC

    Tämän menetelmän pääideana on, että neliövirheiden summaa pidetään kriteerinä ongelman ratkaisun tarkkuudelle, jota pyritään minimoimaan. Tätä menetelmää käytettäessä voidaan soveltaa sekä numeerista että analyyttistä lähestymistapaa.

    Erityisesti numeerisena toteutuksena pienimmän neliösumman menetelmä tarkoittaa, että tuntemattomasta satunnaismuuttujasta tehdään mahdollisimman monta mittausta. Lisäksi mitä enemmän laskelmia, sitä tarkempi ratkaisu on. Tällä laskelmasarjalla (alkutiedot) saadaan toinen joukko ehdotettuja ratkaisuja, joista sitten valitaan paras. Jos ratkaisujoukko on parametroitu, pienimmän neliösumman menetelmä pelkistetään parametrien optimaalisen arvon löytämiseen.

    Analyyttisenä lähestymistapana LSM:n toteuttamiseen lähtötietojen (mittausten) ja ehdotettujen ratkaisujen joukkoon määritellään joitakin (funktionaalisia), jotka voidaan ilmaista kaavalla, joka on saatu tiettynä hypoteesina, joka on vahvistettava. Tässä tapauksessa pienimmän neliösumman menetelmä pelkistetään tämän funktion minimin löytämiseen lähtötietojen neliövirheiden joukosta.

    Huomaa, että eivät itse virheet, vaan virheiden neliöt. Miksi? Tosiasia on, että usein mittausten poikkeamat tarkasta arvosta ovat sekä positiivisia että negatiivisia. Keskiarvoa määritettäessä yksinkertainen summaus voi johtaa virheelliseen johtopäätökseen arvion laadusta, koska positiivisten ja negatiivisten arvojen keskinäinen peruuttaminen vähentää mittausjoukon näytteenottotehoa. Ja näin ollen arvioinnin tarkkuus.

    Tämän estämiseksi neliöidyt poikkeamat lasketaan yhteen. Vielä enemmän, jotta mitatun arvon ja lopullisen estimaatin ulottuvuus tasoitetaan, erotellaan neliövirheiden summaa.

    Jotkut MNC-sovellukset

    MNC:tä käytetään laajasti eri aloilla. Esimerkiksi todennäköisyysteoriassa ja matemaattisissa tilastoissa menetelmää käytetään sellaisen satunnaismuuttujan ominaisuuden määrittämiseen kuin keskihajonta, joka määrittää satunnaismuuttujan arvoalueen leveyden.

    Pienimmän neliön menetelmä käytetään estimoimaan regressioyhtälön parametrit.
    Rivien lukumäärä (alkutiedot)

    Yksi menetelmistä piirteiden välisten stokastisten suhteiden tutkimiseksi on regressioanalyysi.
    Regressioanalyysi on regressioyhtälön johtaminen, jolla saadaan selville satunnaismuuttujan keskiarvo (ominaisuus-tulos), jos toisen (tai muun) muuttujan (ominaisuus-tekijän) arvo tunnetaan. Se sisältää seuraavat vaiheet:

    1. yhteysmuodon valinta (analyyttisen regressioyhtälön tyyppi);
    2. yhtälöparametrien estimointi;
    3. analyyttisen regressioyhtälön laadun arviointi.
    Useimmiten lineaarista muotoa käytetään kuvaamaan piirteiden tilastollista suhdetta. Lineaariseen suhteeseen kiinnittäminen selittyy sen parametrien selkeällä taloudellisella tulkinnalla, jota rajoittaa muuttujien vaihtelu, ja sillä, että useimmissa tapauksissa epälineaariset suhteen muodot muunnetaan (ottamalla logaritmi tai muuttamalla muuttujia) lineaariseen muotoon laskelmien suorittamista varten.
    Lineaarisen parisuhteen tapauksessa regressioyhtälö saa muotoa: y i =a+b·x i +u i . Tämän yhtälön a ja b parametrit on arvioitu tilastollisen havainnon x ja y tiedoista. Tällaisen arvioinnin tuloksena saadaan yhtälö: , jossa , - parametrien a ja b estimaatit, - regressioyhtälöllä saadun tehollisen ominaisuuden (muuttujan) arvo (laskettu arvo).

    Yleisimmin käytetty parametrien arvioinnissa on pienimmän neliösumman menetelmä (LSM).
    Pienimmän neliösumman menetelmä antaa parhaat (yhdenmukaiset, tehokkaat ja puolueettomat) arviot regressioyhtälön parametreista. Mutta vain jos tietyt oletukset satunnaistermistä (u) ja riippumattomasta muuttujasta (x) täyttyvät (katso OLS-oletukset).

    Ongelma lineaarisen pariyhtälön parametrien estimoimiseksi pienimmän neliösumman menetelmällä koostuu seuraavasta: saada sellaiset parametrien estimaatit , joissa tehollisen ominaisuuden - y i - todellisten arvojen neliöpoikkeamien summa lasketuista arvoista on minimaalinen.
    Muodollisesti OLS-kriteeri voidaan kirjoittaa näin: .

    Pienimmän neliösumman menetelmien luokittelu

    1. Pienimmän neliön menetelmä.
    2. Maksimitodennäköisyysmenetelmä (normaalissa klassisessa lineaarisessa regressiomallissa oletetaan regressiojäännösten normaaliutta).
    3. GLSM:n yleistettyä pienimmän neliösumman menetelmää käytetään virheautokorrelaatiossa ja heteroskedastisuuden tapauksessa.
    4. Painotettu pienimmän neliösumman menetelmä (GLSM:n erikoistapaus heteroskedastisten jäännösten kanssa).

    Kuvaa olemusta klassinen pienimmän neliösumman menetelmä graafisesti. Tätä varten rakennamme havaintotietojen (x i , y i , i=1;n) mukaisen pistekuvaajan suorakaiteen muotoiseen koordinaattijärjestelmään (tällaista pistekuvaajaa kutsutaan korrelaatiokentällä). Yritetään löytää suora, joka on lähinnä korrelaatiokentän pisteitä. Pienimmän neliösumman menetelmän mukaan suora valitaan siten, että korrelaatiokentän pisteiden ja tämän suoran välisten pystysuorien etäisyyksien neliösumma olisi minimaalinen.

    Tämän ongelman matemaattinen merkintä: .
    Arvot y i ja x i =1...n ovat meille tiedossa, nämä ovat havaintotietoja. Funktiossa S ne ovat vakioita. Tämän funktion muuttujat ovat parametrien - , . Kahden muuttujan funktion minimin löytämiseksi on tarpeen laskea tämän funktion osittaiset derivaatat kunkin parametrin suhteen ja rinnastaa ne nollaan, ts. .
    Tuloksena saamme kahden normaalin lineaarisen yhtälön järjestelmän:
    Ratkaisemalla tämän järjestelmän löydämme tarvittavat parametriarviot:

    Regressioyhtälön parametrien laskennan oikeellisuus voidaan tarkistaa vertaamalla summia (jotkin poikkeamat ovat mahdollisia laskelmien pyöristyksestä johtuen).
    Voit laskea parametriarviot rakentamalla taulukon 1.
    Regressiokertoimen b etumerkki ilmaisee suhteen suunnan (jos b > 0, suhde on suora, jos b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
    Muodollisesti parametrin a arvo on y:n keskiarvo, kun x on yhtä suuri kuin nolla. Jos etumerkkitekijällä ei ole eikä voi olla nolla-arvoa, niin yllä oleva parametrin a tulkinta ei ole järkevä.

    Ominaisuuksien välisen suhteen tiukkuuden arviointi suoritetaan käyttämällä lineaarisen parin korrelaatiokerrointa - r x,y . Se voidaan laskea kaavalla: . Lisäksi lineaarisen parin korrelaatiokerroin voidaan määrittää regressiokertoimella b: .
    Lineaarisen parikorrelaatiokertoimen sallittujen arvojen alue on -1 - +1. Korrelaatiokertoimen etumerkki ilmaisee suhteen suunnan. Jos r x, y >0, yhteys on suora; jos r x, y<0, то связь обратная.
    Jos tämä kerroin on lähellä yksikköä moduulissa, niin piirteiden välinen suhde voidaan tulkita melko läheiseksi lineaariseksi. Jos sen moduuli on yhtä suuri kuin yksi ê r x , y ê =1, niin piirteiden välinen suhde on funktionaalinen lineaarinen. Jos ominaisuudet x ja y ovat lineaarisesti riippumattomia, niin r x,y on lähellä nollaa.
    Taulukkoa 1 voidaan käyttää myös r x,y:n laskemiseen.

    pöytä 1

    N havaintojax iy ix i ∙ y i
    1 x 1v 1x 1 v 1
    2 x2y2x 2 v 2
    ...
    nx ny nx n y n
    Sarakkeen summa∑x∑y∑x y
    Tarkoittaa
    Saadun regressioyhtälön laadun arvioimiseksi lasketaan teoreettinen determinaatiokerroin - R 2 yx:

    ,
    missä d 2 on regressioyhtälön selitetty varianssi y;
    e 2 - jäännösvarianssi (regressioyhtälön selittämätön) varianssi y ;
    s 2 y - kokonaisvarianssi y .
    Determinaatiokerroin kuvaa tuloksena olevan ominaisuuden y vaihtelun (dispersion) osuutta, joka on selitetty regressiolla (ja siten tekijällä x), kokonaisvariaatiossa (dispersiossa) y. Determinaatiokerroin R 2 yx saa arvot välillä 0 - 1. Vastaavasti arvo 1-R 2 yx kuvaa varianssin y osuutta, joka aiheutuu muiden mallissa huomioimattomien tekijöiden vaikutuksesta ja spesifikaatiovirheistä.
    Lineaarisella regressiolla R 2 yx =r 2 yx .

    Aiheeseen liittyvät julkaisut