Metoda e katrorëve më të vegjël shembuj të zgjidhjes së problemit. Përafrimi i të dhënave eksperimentale

  • Programimi
    • tutorial

    Prezantimi

    Unë jam një programues kompjuteri. Kam bërë hapin më të madh në karrierën time kur mësova të them: "Unë nuk e kuptoj asgjë!" Tani nuk më vjen turp t'i them korifeut të shkencës se po më mban një leksion, se nuk e kuptoj se për çfarë më flet ai, iluminari. Dhe është shumë e vështirë. Po, është e vështirë dhe e turpshme të pranosh se nuk e di. Kush i pëlqen të pranojë se ai nuk i di bazat e diçkaje - atje. Për shkak të profesionit tim, më duhet të ndjek një numër të madh prezantimesh dhe leksionesh, ku, rrëfej, në shumicën dërrmuese të rasteve më vjen gjumi, sepse nuk kuptoj asgjë. Dhe nuk e kuptoj sepse problemi i madh i situatës aktuale në shkencë qëndron te matematika. Ai supozon se të gjithë studentët janë të njohur me absolutisht të gjitha fushat e matematikës (gjë që është absurde). Të pranosh që nuk e di se çfarë është derivati ​​(që kjo është pak më vonë) është turp.

    Por kam mësuar të them se nuk e di se çfarë është shumëzimi. Po, nuk e di se çfarë është një subalgjebër mbi një algjebër Lie. Po, nuk e di pse duhen ekuacionet kuadratike në jetë. Meqë ra fjala, nëse jeni të sigurt që e dini, atëherë kemi diçka për të folur! Matematika është një seri trukesh. Matematikanët përpiqen të ngatërrojnë dhe frikësojnë publikun; aty ku nuk ka konfuzion, reputacion, autoritet. Po, është prestigjioze të flasësh në gjuhën më abstrakte të mundshme, që është absurditet i plotë në vetvete.

    A e dini se çfarë është një derivat? Me shumë mundësi do të më tregoni për kufirin e marrëdhënies së diferencës. Në vitin e parë të matematikës në Universitetin Shtetëror të Shën Petersburgut, Viktor Petrovich Khavin mua të përcaktuara derivati ​​si koeficienti i termit të parë të serisë Taylor të funksionit në pikë (ishte një gjimnastikë e veçantë për të përcaktuar serinë Taylor pa derivate). Kam qeshur me këtë përkufizim për një kohë të gjatë, derisa më në fund kuptova se për çfarë bëhej fjalë. Derivati ​​nuk është gjë tjetër veçse thjesht një masë se sa funksioni që po diferencojmë është i ngjashëm me funksionin y=x, y=x^2, y=x^3.

    Tani kam nderin të ligjëroj studentë të cilët frikë matematikë. Nëse keni frikë nga matematika - ne jemi në rrugë. Sapo provoni të lexoni ndonjë tekst dhe ju duket se është tepër i ndërlikuar, atëherë dijeni se është shkruar keq. Unë argumentoj se nuk ka asnjë fushë të vetme të matematikës për të cilën nuk mund të flitet "në gishta" pa humbur saktësinë.

    Sfida e së ardhmes: Unë i udhëzova studentët e mi të kuptojnë se çfarë është një kontrollues linear-kuadratik. Mos kini turp, humbisni tre minuta nga jeta juaj, ndiqni lidhjen. Nëse nuk kuptoni asgjë, atëherë ne jemi në rrugë. Unë (një matematikan-programues profesionist) gjithashtu nuk kuptova asgjë. Dhe ju siguroj, kjo mund të zgjidhet "në gishta". Për momentin nuk e di se çfarë është, por ju siguroj se do të jemi në gjendje ta kuptojmë.

    Pra, leksioni i parë që do t'u jap studentëve të mi pasi të vijnë me vrap tek unë të tmerruar me fjalët se një kontrollues linear-kuadratik është një defekt i tmerrshëm që nuk do ta zotëroni kurrë në jetën tuaj është metodat e katrorëve më të vegjël. A mund të zgjidhni ekuacionet lineare? Nëse jeni duke e lexuar këtë tekst, atëherë ka shumë të ngjarë që jo.

    Pra, duke pasur parasysh dy pika (x0, y0), (x1, y1), për shembull, (1,1) dhe (3,2), detyra është të gjejmë ekuacionin e një drejtëze që kalon nëpër këto dy pika:

    ilustrim

    Kjo vijë e drejtë duhet të ketë një ekuacion si më poshtë:

    Këtu alfa dhe beta janë të panjohura për ne, por dy pika të kësaj linje janë të njohura:

    Ju mund ta shkruani këtë ekuacion në formën e matricës:

    Këtu duhet të bëjmë një digresion lirik: çfarë është një matricë? Një matricë nuk është gjë tjetër veçse një grup dy-dimensionale. Kjo është një mënyrë për të ruajtur të dhënat, nuk duhet t'i jepen më vlera. Varet nga ne se si ta interpretojmë saktësisht një matricë të caktuar. Periodikisht, unë do ta interpretoj atë si një hartë lineare, periodikisht si një formë kuadratike dhe ndonjëherë thjesht si një grup vektorësh. E gjithë kjo do të sqarohet në kontekst.

    Le të zëvendësojmë matricat specifike me paraqitjen e tyre simbolike:

    Pastaj (alfa, beta) mund të gjendet lehtësisht:

    Më konkretisht për të dhënat tona të mëparshme:

    Që çon në ekuacionin vijues të një drejtëze që kalon nëpër pikat (1,1) dhe (3,2):

    Në rregull, gjithçka është e qartë këtu. Dhe le të gjejmë ekuacionin e një drejtëze që kalon tre pikat: (x0,y0), (x1,y1) dhe (x2,y2):

    Oh-oh-oh, por ne kemi tre ekuacione për dy të panjohura! Matematikani standard do të thotë se nuk ka zgjidhje. Çfarë do të thotë programuesi? Dhe ai së pari do të rishkruajë sistemin e mëparshëm të ekuacioneve në formën e mëposhtme:

    Në rastin tonë, vektorët i, j, b janë tre-dimensionale, prandaj, (në rastin e përgjithshëm) nuk ka zgjidhje për këtë sistem. Çdo vektor (alfa\*i + beta\*j) shtrihet në rrafshin e shtrirë nga vektorët (i, j). Nëse b nuk i përket këtij rrafshi, atëherë nuk ka zgjidhje (barazia në ekuacion nuk mund të arrihet). Çfarë duhet bërë? Le të kërkojmë një kompromis. Le të shënojmë me e(alfa, beta) si saktësisht nuk arritëm barazi:

    Dhe ne do të përpiqemi të minimizojmë këtë gabim:

    Pse një shesh?

    Ne po kërkojmë jo vetëm minimumin e normës, por minimumin e katrorit të normës. Pse? Pika minimale në vetvete përkon, dhe katrori jep një funksion të qetë (një funksion kuadratik i argumenteve (alfa, beta)), ndërsa vetëm gjatësia jep një funksion në formën e një koni, i padiferencueshëm në pikën minimale. Brr. Sheshi është më i përshtatshëm.

    Natyrisht, gabimi minimizohet kur vektori e ortogonal me rrafshin e shtrirë nga vektorët i dhe j.

    Ilustrim

    Me fjalë të tjera: ne po kërkojmë një vijë të tillë që shuma e gjatësive në katror të distancave nga të gjitha pikat në këtë vijë të jetë minimale:

    PËRDITËSIM: këtu kam një bllokim, distanca në vijë duhet të matet vertikalisht, jo projeksioni drejtshkrimor. komentuesi ka te drejte.

    Ilustrim

    Me fjalë krejtësisht të ndryshme (me kujdes, të zyrtarizuar dobët, por duhet të jetë e qartë në gishta): marrim të gjitha linjat e mundshme midis të gjitha palëve të pikave dhe kërkojmë vijën mesatare midis të gjithave:

    Ilustrim

    Një shpjegim tjetër në gishta: ne bashkojmë një pranverë midis të gjitha pikave të të dhënave (këtu kemi tre) dhe vijës që kërkojmë, dhe vija e gjendjes së ekuilibrit është pikërisht ajo që kërkojmë.

    Minimumi i formës kuadratike

    Pra, duke pasur parasysh vektorin b dhe plani i shtrirë nga kolonat-vektorët e matricës A(në këtë rast (x0,x1,x2) dhe (1,1,1)), ne jemi duke kërkuar për një vektor e me një katror minimal të gjatësisë. Natyrisht, minimumi është i arritshëm vetëm për vektorin e, ortogonal me planin e shtrirë nga kolonat-vektorët e matricës A:

    Me fjalë të tjera, ne jemi duke kërkuar për një vektor x=(alfa, beta) të tillë që:

    Ju kujtoj se ky vektor x=(alfa, beta) është minimumi i funksionit kuadratik ||e(alfa, beta)||^2:

    Këtu është e dobishme të mbani mend se matrica mund të interpretohet si dhe forma kuadratike, për shembull, matrica e identitetit ((1,0),(0,1)) mund të interpretohet si funksion i x^2 + y ^2:

    formë kuadratike

    E gjithë kjo gjimnastikë njihet si regresion linear.

    Ekuacioni i Laplasit me kushtin kufitar të Dirichlet-it

    Tani problemi më i thjeshtë real: ekziston një sipërfaqe e caktuar trekëndore, është e nevojshme ta lëmoni atë. Për shembull, le të ngarkojmë modelin tim të fytyrës:

    Angazhimi origjinal është i disponueshëm. Për të minimizuar varësitë e jashtme, mora kodin e interpretuesit tim të softuerit, tashmë në Habré. Për të zgjidhur sistemin linear, unë përdor OpenNL, është një zgjidhës i shkëlqyeshëm, por është shumë i vështirë për t'u instaluar: duhet të kopjoni dy skedarë (.h + .c) në dosjen tuaj të projektit. I gjithë zbutja bëhet me kodin e mëposhtëm:

    Për (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&fytyrë = fytyra[i]; për (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

    Koordinatat X, Y dhe Z janë të ndashme, i lëmoj veçmas. Kjo do të thotë, unë zgjidh tre sisteme ekuacionesh lineare, secili me të njëjtin numër variablash si numri i kulmeve në modelin tim. N rreshtat e parë të matricës A kanë vetëm një 1 për rresht, dhe n rreshtat e parë të vektorit b kanë koordinata origjinale të modelit. Kjo do të thotë, unë lidhem ndërmjet pozicionit të kulmit të ri dhe pozicionit të kulmit të vjetër - të rejat nuk duhet të jenë shumë larg nga të vjetrat.

    Të gjitha rreshtat e mëpasshëm të matricës A (faces.size()*3 = numri i skajeve të të gjithë trekëndëshave në rrjet) kanë një paraqitje prej 1 dhe një paraqitje prej -1, ndërsa vektori b ka zero komponentë të kundërt. Kjo do të thotë që unë vendos një sustë në çdo skaj të rrjetës sonë trekëndore: të gjitha skajet përpiqen të marrin të njëjtin kulm si pikat e tyre të fillimit dhe të përfundimit.

    Edhe një herë: të gjitha kulmet janë variabla dhe nuk mund të devijojnë larg pozicionit të tyre origjinal, por në të njëjtën kohë përpiqen të bëhen të ngjashëm me njëri-tjetrin.

    Këtu është rezultati:

    Gjithçka do të ishte mirë, modeli është me të vërtetë i zbutur, por u largua nga skaji i tij origjinal. Le të ndryshojmë pak kodin:

    Për (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

    Në matricën tonë A, për kulmet që janë në buzë, nuk shtoj një rresht nga kategoria v_i = verts[i][d], por 1000*v_i = 1000*verts[i][d]. Çfarë ndryshon? Dhe kjo ndryshon formën tonë kuadratike të gabimit. Tani një devijim i vetëm nga lart në skaj do të kushtojë jo një njësi, si më parë, por 1000 * 1000 njësi. Kjo do të thotë, ne varëm një sustë më të fortë në kulmet ekstreme, zgjidhja preferon t'i shtrijë të tjerët më fort. Këtu është rezultati:

    Le të dyfishojmë forcën e sustave midis kulmeve:
    nlKoeficienti(fytyra[ j ], 2); nlKoeficienti(fytyra[(j+1)%3], -2);

    Është logjike që sipërfaqja është bërë më e lëmuar:

    Dhe tani edhe njëqind herë më e fortë:

    Çfarë është kjo? Imagjinoni sikur kemi zhytur një unazë teli në ujë me sapun. Si rezultat, filmi i sapunit që rezulton do të përpiqet të ketë sa më pak lakim të jetë e mundur, duke prekur të njëjtin kufi - unazën tonë teli. Kjo është pikërisht ajo që kemi marrë duke rregulluar kufirin dhe duke kërkuar një sipërfaqe të lëmuar brenda. Urime, sapo kemi zgjidhur ekuacionin Laplace me kushtet kufitare të Dirichlet-it. Tingëllon bukur? Por në fakt, duhet zgjidhur vetëm një sistem ekuacionesh lineare.

    Ekuacioni Poisson

    Le të kujtojmë një tjetër emër të lezetshëm.

    Le të themi se kam një imazh si ky:

    Të gjithë janë të mirë, por nuk më pëlqen karrigia.

    E preva foton përgjysmë:



    Dhe unë do të zgjedh një karrige me duart e mia:

    Pastaj do të tërhiq gjithçka që është e bardhë në maskë në anën e majtë të figurës dhe në të njëjtën kohë do të them në të gjithë figurën se ndryshimi midis dy pikselëve fqinjë duhet të jetë i barabartë me diferencën midis dy pikselëve fqinjë të figurës. imazhi i duhur:

    Për (int i=0; i

    Këtu është rezultati:

    Kodi dhe fotografitë janë në dispozicion

    I cili gjen aplikimin më të gjerë në fusha të ndryshme të shkencës dhe praktikës. Mund të jetë fizika, kimia, biologjia, ekonomia, sociologjia, psikologjia e kështu me radhë e kështu me radhë. Me vullnetin e fatit, shpesh më duhet të merrem me ekonominë, dhe për këtë arsye sot do të organizoj për ju një biletë për në një vend të mahnitshëm të quajtur Ekonometria=) … Si nuk e doni këtë?! Është shumë mirë atje - ju vetëm duhet të vendosni! …Por ajo që me siguri dëshironi patjetër është të mësoni se si t'i zgjidhni problemet katrorët më të vegjël. Dhe veçanërisht lexuesit e zellshëm do të mësojnë t'i zgjidhin ato jo vetëm me saktësi, por edhe SHUMË SHPEJTË ;-) Por së pari deklaratë e përgjithshme e problemit+ shembull i lidhur:

    Le të studiohen treguesit në disa fusha lëndore që kanë një shprehje sasiore. Në të njëjtën kohë, ka çdo arsye për të besuar se treguesi varet nga treguesi. Ky supozim mund të jetë edhe një hipotezë shkencore dhe e bazuar në sensin elementar të përbashkët. Megjithatë, le ta lëmë mënjanë shkencën dhe të eksplorojmë zona më të shijshme - domethënë, dyqanet ushqimore. Shëno me:

    – hapësira me pakicë e një dyqani ushqimor, m2,
    - qarkullimi vjetor i një dyqani ushqimor, milion rubla.

    Është mjaft e qartë se sa më e madhe të jetë sipërfaqja e dyqanit, aq më i madh është qarkullimi i tij në shumicën e rasteve.

    Supozoni se pas kryerjes së vëzhgimeve / eksperimenteve / llogaritjeve / vallëzimit me një dajre, ne kemi në dispozicion të dhëna numerike:

    Me dyqanet ushqimore, mendoj se gjithçka është e qartë: - kjo është zona e dyqanit të parë, - qarkullimi vjetor i tij, - zona e dyqanit të dytë, - xhiroja vjetore e tij, etj. Nga rruga, nuk është aspak e nevojshme të kesh akses në materialet e klasifikuara - një vlerësim mjaft i saktë i qarkullimit mund të merret duke përdorur statistika matematikore. Sidoqoftë, mos u hutoni, kursi i spiunazhit tregtar tashmë është paguar =)

    Të dhënat tabelare gjithashtu mund të shkruhen në formën e pikave dhe të përshkruhen në mënyrën e zakonshme për ne. Sistemi kartezian .

    Le t'i përgjigjemi një pyetjeje të rëndësishme: sa pikë nevojiten për një studim cilësor?

    Sa më i madh, aq më mirë. Seti minimal i pranueshëm përbëhet nga 5-6 pikë. Përveç kësaj, me një sasi të vogël të dhënash, rezultatet "jonormale" nuk duhet të përfshihen në mostër. Kështu, për shembull, një dyqan i vogël elitar mund të ndihmojë më shumë se "kolegët e tyre", duke shtrembëruar modelin e përgjithshëm që duhet gjetur!

    Nëse është mjaft e thjeshtë, duhet të zgjedhim një funksion, orarin i cili kalon sa më afër pikave . Një funksion i tillë quhet të përafërt (përafrim - përafrim) ose funksioni teorik . Në përgjithësi, këtu shfaqet menjëherë një "pretendues" i dukshëm - një polinom i shkallës së lartë, grafiku i të cilit kalon nëpër TË GJITHA pikat. Por ky opsion është i ndërlikuar dhe shpesh thjesht i pasaktë. (sepse grafiku do të "erë" gjatë gjithë kohës dhe do të pasqyrojë dobët tendencën kryesore).

    Kështu, funksioni i dëshiruar duhet të jetë mjaft i thjeshtë dhe në të njëjtën kohë të pasqyrojë varësinë në mënyrë adekuate. Siç mund ta merrni me mend, quhet një nga metodat për gjetjen e funksioneve të tilla katrorët më të vegjël. Së pari, le të analizojmë thelbin e saj në një mënyrë të përgjithshme. Lëreni disa funksione të përafrojnë të dhënat eksperimentale:


    Si të vlerësohet saktësia e këtij përafrimi? Le të llogarisim edhe dallimet (devijimet) midis vlerave eksperimentale dhe funksionale (ne studiojmë vizatimin). Mendimi i parë që vjen në mendje është të vlerësojmë se sa e madhe është shuma, por problemi është se diferencat mund të jenë negative. (për shembull, ) dhe devijimet si rezultat i një përmbledhjeje të tillë do të anulojnë njëra-tjetrën. Prandaj, si një vlerësim i saktësisë së përafrimit, ai sugjeron veten të marrë shumën modulet devijimet:

    ose në formë të palosur: (papritur, kush nuk e di: është ikona e shumës, dhe është një variabël ndihmës-"numërues", i cili merr vlera nga 1 në ).

    Duke përafruar pikat eksperimentale me funksione të ndryshme, do të marrim vlera të ndryshme të , dhe është e qartë se aty ku kjo shumë është më e vogël, ai funksion është më i saktë.

    Një metodë e tillë ekziston dhe quhet metoda e modulit më të vogël. Megjithatë, në praktikë është bërë shumë më e përhapur. metoda më e vogël e katrorit, në të cilën vlerat e mundshme negative eliminohen jo nga moduli, por nga katrori i devijimeve:

    , pas së cilës përpjekjet drejtohen në përzgjedhjen e një funksioni të tillë që shuma e devijimeve në katror ishte sa më i vogël. Në fakt, kështu emri i metodës.

    Dhe tani kthehemi në një pikë tjetër të rëndësishme: siç u përmend më lart, funksioni i zgjedhur duhet të jetë mjaft i thjeshtë - por ka edhe shumë funksione të tilla: lineare , hiperbolike, eksponenciale, logaritmike, kuadratike etj. Dhe, natyrisht, këtu do të doja menjëherë të "zvogëloja fushën e veprimtarisë". Çfarë klase funksionesh të zgjidhni për kërkime? Teknika primitive por efektive:

    - Mënyra më e lehtë për të tërhequr pikë në vizatim dhe analizoni vendndodhjen e tyre. Nëse ato priren të jenë në një vijë të drejtë, atëherë duhet të kërkoni ekuacioni drejtvizor me vlera optimale dhe . Me fjalë të tjera, detyra është të gjesh koeficientë të tillë - në mënyrë që shuma e devijimeve në katror të jetë më e vogla.

    Nëse pikat janë të vendosura, për shembull, përgjatë hiperbolë, atëherë është e qartë se funksioni linear do të japë një përafrim të dobët. Në këtë rast, ne jemi duke kërkuar për koeficientët më "të favorshëm" për ekuacionin e hiperbolës - ato që japin shumën minimale të katrorëve .

    Tani vini re se në të dyja rastet po flasim funksionet e dy ndryshoreve, argumentet e të cilit janë opsionet e kërkimit të varësisë:

    Dhe në thelb, ne duhet të zgjidhim një problem standard - të gjejmë minimumi i një funksioni prej dy ndryshoresh.

    Kujtoni shembullin tonë: supozoni se pikat "dyqani" priren të vendosen në një vijë të drejtë dhe ka çdo arsye për të besuar praninë varësia lineare qarkullim nga zona e tregtimit. Le të gjejmë koeficientë të tillë "a" dhe "be" në mënyrë që shuma e devijimeve në katror ishte më i vogli. Gjithçka si zakonisht - së pari derivatet e pjesshme të rendit të parë. Sipas rregulli i linearitetit ju mund të dalloni pikërisht nën ikonën e shumës:

    Nëse dëshironi të përdorni këtë informacion për një ese ose lëndë, do të jem shumë mirënjohës për lidhjen në listën e burimeve, nuk do të gjeni askund llogaritje të tilla të detajuara:

    Le të bëjmë një sistem standard:

    Ne zvogëlojmë çdo ekuacion me një "dy" dhe, përveç kësaj, "ndajmë" shumat:

    shënim : analizoni në mënyrë të pavarur pse "a" dhe "be" mund të hiqen nga ikona e shumës. Nga rruga, zyrtarisht kjo mund të bëhet me shumën

    Le ta rishkruajmë sistemin në një formë "të aplikuar":

    pas së cilës fillon të vizatohet algoritmi për zgjidhjen e problemit tonë:

    A i dimë koordinatat e pikave? E dimë. Shumat mund te gjejme? Lehtësisht. Ne kompozojmë më të thjeshtën sistemi i dy ekuacioneve lineare me dy të panjohura("a" dhe "beh"). Ne e zgjidhim sistemin, për shembull, Metoda e Cramer-it, duke rezultuar në një pikë të palëvizshme . Duke kontrolluar kusht i mjaftueshëm për një ekstrem, mund të verifikojmë se në këtë pikë funksioni arrin saktësisht minimale. Verifikimi shoqërohet me përllogaritje shtesë dhe për këtë arsye do ta lëmë në prapaskenë. (nëse është e nevojshme, korniza që mungon mund të shihet). Ne nxjerrim përfundimin përfundimtar:

    Funksioni menyra me e mire (të paktën krahasuar me çdo funksion tjetër linear) afron pikat eksperimentale . Përafërsisht, grafiku i tij kalon sa më afër këtyre pikave. Në traditë ekonometria quhet edhe funksioni i përafërt që rezulton ekuacioni i regresionit linear të çiftëzuar .

    Problemi në shqyrtim ka një rëndësi të madhe praktike. Në situatën me shembullin tonë, ekuacioni ju lejon të parashikoni se çfarë lloj qarkullimi ("yig") do të jetë në dyqan me një ose një tjetër vlerë të zonës së shitjes (një ose një kuptim tjetër i "x"). Po, parashikimi që rezulton do të jetë vetëm një parashikim, por në shumë raste do të dalë mjaft i saktë.

    Unë do të analizoj vetëm një problem me numrat "realë", pasi nuk ka vështirësi në të - të gjitha llogaritjet janë në nivelin e kurrikulës shkollore në klasat 7-8. Në 95 për qind të rasteve, do t'ju kërkohet të gjeni vetëm një funksion linear, por në fund të artikullit do të tregoj se nuk është më e vështirë të gjesh ekuacionet për hiperbolën optimale, eksponentin dhe disa funksione të tjera.

    Në fakt, mbetet të shpërndani të mirat e premtuara - në mënyrë që të mësoni se si t'i zgjidhni shembuj të tillë jo vetëm me saktësi, por edhe shpejt. Ne studiojmë me kujdes standardin:

    Një detyrë

    Si rezultat i studimit të marrëdhënies midis dy treguesve, u morën çiftet e mëposhtme të numrave:

    Duke përdorur metodën e katrorëve më të vegjël, gjeni funksionin linear që përafron më mirë atë empirik (me eksperience) të dhëna. Bëni një vizatim mbi të cilin, në një sistem koordinativ drejtkëndor kartezian, vizatoni pika eksperimentale dhe një grafik të funksionit të përafërt . Gjeni shumën e devijimeve në katror ndërmjet vlerave empirike dhe teorike. Zbuloni nëse funksioni do të jetë më i mirë (për sa i përket metodës së katrorëve më të vegjël) pikat e përafërta eksperimentale.

    Vini re se vlerat "x" janë vlera natyrore, dhe kjo ka një kuptim karakteristik kuptimplotë, për të cilin do të flas pak më vonë; por ato, natyrisht, mund të jenë të pjesshme. Për më tepër, në varësi të përmbajtjes së një detyre të veçantë, të dyja vlerat "X" dhe "G" mund të jenë plotësisht ose pjesërisht negative. Epo, na është dhënë një detyrë "pa fytyrë" dhe ne e fillojmë atë zgjidhje:

    Ne gjejmë koeficientët e funksionit optimal si zgjidhje për sistemin:

    Për qëllime të një shënimi më kompakt, ndryshorja "kundër" mund të hiqet, pasi tashmë është e qartë se përmbledhja kryhet nga 1 në .

    Është më i përshtatshëm për të llogaritur shumat e kërkuara në një formë tabelare:


    Llogaritjet mund të kryhen në një mikrollogaritës, por është shumë më mirë të përdorni Excel - më shpejt dhe pa gabime; shikoni një video të shkurtër:

    Kështu, marrim sa vijon sistemi:

    Këtu mund të shumëzoni ekuacionin e dytë me 3 dhe Zbrisni të 2-tin nga ekuacioni i 1-rë termi për term. Por ky është fat - në praktikë, sistemet shpesh nuk janë të talentuara dhe në raste të tilla kursen Metoda e Cramer-it:
    , kështu që sistemi ka një zgjidhje unike.

    Le të bëjmë një kontroll. E kuptoj që nuk dua, por pse të anashkaloni gabimet ku nuk mund t'i humbisni absolutisht? Zëvendësoni zgjidhjen e gjetur në anën e majtë të secilit ekuacion të sistemit:

    Përftohen pjesët e duhura të ekuacioneve përkatëse, që do të thotë se sistemi është zgjidhur saktë.

    Kështu, funksioni i dëshiruar përafrues: – nga të gjitha funksionet lineare të dhënat eksperimentale përafrohen më së miri prej saj.

    Ndryshe nga drejt varësia e xhiros së dyqanit nga zona e tij, varësia e gjetur është e kundërta (parimi "sa më shumë - aq më pak"), dhe ky fakt zbulohet menjëherë nga negativi koeficienti këndor. Funksioni na informon se me një rritje të një treguesi të caktuar me 1 njësi, vlera e treguesit të varur zvogëlohet mesatare me 0.65 njësi. Siç thonë ata, sa më i lartë të jetë çmimi i hikërrorit, aq më pak shitet.

    Për të grafikuar funksionin e përafërt, gjejmë dy nga vlerat e tij:

    dhe ekzekutoni vizatimin:


    Linja e ndërtuar quhet linjë trendi (domethënë, një linjë trendi lineare, d.m.th. në rastin e përgjithshëm, një trend nuk është domosdoshmërisht një vijë e drejtë). Të gjithë e njohin shprehjen “të jesh në trend”, dhe mendoj se ky term nuk ka nevojë për komente shtesë.

    Llogaritni shumën e devijimeve në katror midis vlerave empirike dhe teorike. Gjeometrikisht, kjo është shuma e katrorëve të gjatësive të segmenteve "të kuq". (dy prej të cilave janë aq të vogla sa nuk mund t'i shihni).

    Le të përmbledhim llogaritjet në një tabelë:


    Ato përsëri mund të kryhen me dorë, vetëm në rast se do të jap një shembull për pikën 1:

    por është shumë më efikase të bësh mënyrën e njohur tashmë:

    Le të përsërisim: cili është kuptimi i rezultatit? Nga të gjitha funksionet lineare në funksion eksponenti është më i vogli, pra në familjen e tij është përafrimi më i mirë. Dhe këtu, meqë ra fjala, pyetja përfundimtare e problemit nuk është e rastësishme: po sikur funksioni eksponencial i propozuar a do të jetë më mirë të përafrohen pikat eksperimentale?

    Le të gjejmë shumën përkatëse të devijimeve në katror - për t'i dalluar ato, do t'i caktoj me shkronjën "epsilon". Teknika është saktësisht e njëjtë:


    Dhe përsëri për çdo llogaritje zjarri për pikën 1:

    Në Excel, ne përdorim funksionin standard EXP (Sintaksa mund të gjendet në Excel Help).

    konkluzioni: , pra funksioni eksponencial i përafron pikat eksperimentale më keq se drejtëza .

    Por këtu duhet theksuar se "më keq" është nuk do të thotë akoma, çfarë nuk shkon. Tani kam ndërtuar një grafik të këtij funksioni eksponencial - dhe ai gjithashtu kalon afër pikave - aq sa pa një studim analitik është e vështirë të thuhet se cili funksion është më i saktë.

    Kjo e plotëson zgjidhjen dhe kthehem te çështja e vlerave natyrore të argumentit. Në studime të ndryshme, si rregull, ekonomike apo sociologjike, muajt, vitet apo intervale të tjera kohore të barabarta numërohen me “X” natyrale. Konsideroni, për shembull, një problem të tillë.

    Katroret më të vegjël është një procedurë matematikore për ndërtimin e një ekuacioni linear që i përshtatet më së miri një grupi çiftesh të renditura duke gjetur vlerat për a dhe b, koeficientët në ekuacionin e një vije të drejtë. Qëllimi i metodës së katrorëve më të vegjël është të minimizojë gabimin total në katror ndërmjet vlerave y dhe ŷ. Nëse për secilën pikë përcaktojmë gabimin ŷ, metoda e katrorëve më të vegjël minimizon:

    ku n = numri i çifteve të renditura rreth vijës. më të rëndësishmet për të dhënat.

    Ky koncept është ilustruar në figurë

    Duke gjykuar nga figura, vija që i përshtatet më së miri të dhënave, vija e regresionit, minimizon gabimin total në katror të katër pikave në grafik. Unë do t'ju tregoj se si ta përcaktoni këtë duke përdorur metodën e katrorëve më të vegjël në shembullin e mëposhtëm.

    Imagjinoni një çift të ri që kohët e fundit jetojnë së bashku dhe ndajnë një tavolinë tualeti. I riu filloi të vinte re se gjysma e tavolinës së tij po tkurej në mënyrë të pashmangshme, duke humbur terren nga shkuma e flokëve dhe komplekset e sojës. Gjatë muajve të fundit, djali ka monitoruar nga afër shkallën me të cilën po rritet numri i artikujve në pjesën e saj të tabelës. Tabela e mëposhtme tregon numrin e objekteve që vajza ka grumbulluar në tavolinën e banjës gjatë muajve të fundit.

    Meqenëse qëllimi ynë është të zbulojmë nëse numri i artikujve rritet me kalimin e kohës, "Muaji" do të jetë ndryshorja e pavarur dhe "Numri i artikujve" do të jetë ndryshorja e varur.

    Duke përdorur metodën e katrorëve më të vegjël, ne përcaktojmë ekuacionin që i përshtatet më mirë të dhënave duke llogaritur vlerat e a, segmentit në boshtin y dhe b, pjerrësinë e vijës:

    a = y cf - bx cf

    ku x cf është vlera mesatare e x, ndryshores së pavarur, y cf është vlera mesatare e y, ndryshores së pavarur.

    Tabela e mëposhtme përmbledh llogaritjet e nevojshme për këto ekuacione.

    Kurba e efektit për shembullin tonë të vaskës do të jepet nga ekuacioni i mëposhtëm:

    Meqenëse ekuacioni ynë ka një pjerrësi pozitive prej 0,976, djali ka prova se numri i artikujve në tryezë rritet me kalimin e kohës me një normë mesatare prej 1 artikulli në muaj. Grafiku tregon lakoren e efektit me çifte të renditura.

    Numri i pritshëm i zërave për gjashtëmujorin e ardhshëm (muaji 16) do të llogaritet si më poshtë:

    ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 artikuj

    Pra, është koha që heroi ynë të ndërmarrë disa veprime.

    Funksioni TREND në Excel

    Siç mund ta keni marrë me mend, Excel ka një funksion për të llogaritur një vlerë Metoda e katrorëve më të vegjël. Ky funksion quhet TREND. Sintaksa e tij është si më poshtë:

    TREND (vlera të njohura Y; vlera të njohura X; vlera të reja X; konst)

    vlerat e njohura të Y - një grup variablash të varur, në rastin tonë, numri i artikujve në tabelë

    vlerat e njohura të X - një grup variablash të pavarur, në rastin tonë është një muaj

    vlerat e reja X - vlerat e reja X (mujore) për të cilat Funksioni TREND kthen vlerën e pritur të variablave të varur (numrin e artikujve)

    const - opsionale. Një vlerë Boolean që specifikon nëse konstanta b kërkohet të jetë 0.

    Për shembull, figura tregon funksionin TREND që përdoret për të përcaktuar numrin e pritur të artikujve në tavolinën e banjës për muajin e 16-të.

    Metoda e katrorëve më të vegjël (LSM) ju lejon të vlerësoni sasi të ndryshme duke përdorur rezultatet e shumë matjeve që përmbajnë gabime të rastësishme.

    MNC karakteristike

    Ideja kryesore e kësaj metode është që shuma e gabimeve në katror të konsiderohet si një kriter për saktësinë e zgjidhjes së problemit, i cili kërkohet të minimizohet. Kur përdoret kjo metodë, mund të aplikohen si përqasjet numerike ashtu edhe ato analitike.

    Në veçanti, si zbatim numerik, metoda e katrorëve më të vegjël nënkupton bërjen e sa më shumë matjeve të një ndryshoreje të rastësishme të panjohur. Për më tepër, sa më shumë llogaritje, aq më e saktë do të jetë zgjidhja. Në këtë grup llogaritjesh (të dhëna fillestare), merret një grup tjetër zgjidhjesh të propozuara, nga të cilat më pas zgjidhet më e mira. Nëse grupi i zgjidhjeve është i parametrizuar, atëherë metoda e katrorëve më të vegjël do të reduktohet në gjetjen e vlerës optimale të parametrave.

    Si një qasje analitike për zbatimin e LSM në grupin e të dhënave fillestare (matjet) dhe grupin e propozuar të zgjidhjeve, përcaktohen disa (funksionale), të cilat mund të shprehen me një formulë të marrë si një hipotezë e caktuar që duhet të konfirmohet. . Në këtë rast, metoda e katrorëve më të vegjël reduktohet në gjetjen e minimumit të këtij funksioni në grupin e gabimeve në katror të të dhënave fillestare.

    Vini re se jo vetë gabimet, por katrorët e gabimeve. Pse? Fakti është se shpesh devijimet e matjeve nga vlera e saktë janë pozitive dhe negative. Gjatë përcaktimit të mesatares, përmbledhja e thjeshtë mund të çojë në një përfundim të gabuar për cilësinë e vlerësimit, pasi anulimi i ndërsjellë i vlerave pozitive dhe negative do të zvogëlojë fuqinë e kampionimit të grupit të matjeve. Dhe, rrjedhimisht, saktësia e vlerësimit.

    Për të parandaluar që kjo të ndodhë, devijimet në katror përmblidhen. Edhe më shumë se kaq, për të barazuar dimensionin e vlerës së matur dhe vlerësimin përfundimtar, nga shuma e gabimeve në katror,

    Disa aplikime të MNC-ve

    MNC përdoret gjerësisht në fusha të ndryshme. Për shembull, në teorinë e probabilitetit dhe statistikat matematikore, metoda përdoret për të përcaktuar një karakteristikë të tillë të një ndryshoreje të rastësishme si devijimi standard, i cili përcakton gjerësinë e gamës së vlerave të një ndryshoreje të rastësishme.

    Metoda me katrorin më të vogël përdoret për të vlerësuar parametrat e ekuacionit të regresionit.
    Numri i rreshtave (të dhënat fillestare)

    Një nga metodat për studimin e marrëdhënieve stokastike midis veçorive është analiza e regresionit.
    Analiza e regresionit është derivimi i një ekuacioni regresioni, i cili përdoret për të gjetur vlerën mesatare të një ndryshoreje të rastësishme (veçori-rezultat), nëse dihet vlera e një ndryshoreje tjetër (ose të tjera) (faktorë-faktorë). Ai përfshin hapat e mëposhtëm:

    1. zgjedhja e formës së lidhjes (lloji i ekuacionit të regresionit analitik);
    2. vlerësimi i parametrave të ekuacionit;
    3. vlerësimi i cilësisë së ekuacionit të regresionit analitik.
    Më shpesh, një formë lineare përdoret për të përshkruar marrëdhënien statistikore të veçorive. Vëmendja ndaj marrëdhënies lineare shpjegohet nga një interpretim i qartë ekonomik i parametrave të tij, i kufizuar nga variacioni i variablave dhe nga fakti që në shumicën e rasteve format jolineare të marrëdhënies konvertohen (duke marrë një logaritëm ose duke ndryshuar variablat) në një formë lineare. për të kryer llogaritjet.
    Në rastin e marrëdhënies së çiftit linear, ekuacioni i regresionit do të marrë formën: y i =a+b·x i +u i . Parametrat e këtij ekuacioni a dhe b vlerësohen nga të dhënat e vëzhgimit statistikor x dhe y. Rezultati i një vlerësimi të tillë është ekuacioni: , ku , - vlerësimet e parametrave a dhe b , - vlera e veçorisë efektive (ndryshores) e përftuar nga ekuacioni i regresionit (vlera e llogaritur).

    Më e përdorura për vlerësimin e parametrave është metoda e katrorëve më të vogël (LSM).
    Metoda e katrorëve më të vegjël jep vlerësimet më të mira (të qëndrueshme, efikase dhe të paanshme) të parametrave të ekuacionit të regresionit. Por vetëm nëse plotësohen supozime të caktuara në lidhje me termin e rastësishëm (u) dhe variablin e pavarur (x) (shih supozimet OLS).

    Problemi i vlerësimit të parametrave të një ekuacioni të çiftit linear me metodën e katrorëve më të vegjël konsiston në sa vijon: për të marrë vlerësime të tilla të parametrave , në të cilat shuma e devijimeve në katror të vlerave aktuale të veçorisë efektive - y i nga vlerat e llogaritura - është minimale.
    Formalisht Kriteri OLS mund të shkruhet kështu: .

    Klasifikimi i metodave të katrorëve më të vegjël

    1. Metoda me katrorin më të vogël.
    2. Metoda e gjasave maksimale (për një model normal klasik të regresionit linear, është postuluar normaliteti i mbetjeve të regresionit).
    3. Metoda e përgjithësuar e katrorëve më të vegjël të GLSM përdoret në rastin e autokorrelacionit të gabimit dhe në rastin e heteroskedasticitetit.
    4. Metoda e katrorëve më të vegjël të ponderuar (një rast i veçantë i GLSM me mbetje heteroskedastike).

    Ilustroni thelbin metoda klasike e katrorëve më të vegjël grafikisht. Për ta bërë këtë, ne do të ndërtojmë një grafik me pika sipas të dhënave të vëzhgimit (x i, y i, i=1;n) në një sistem koordinativ drejtkëndor (një grafik i tillë pikash quhet fushë korrelacioni). Le të përpiqemi të gjejmë një vijë të drejtë që është më afër pikave të fushës së korrelacionit. Sipas metodës së katrorëve më të vegjël, vija zgjidhet në mënyrë që shuma e distancave vertikale në katror ndërmjet pikave të fushës së korrelacionit dhe kësaj drejtëze të jetë minimale.

    Shënimi matematik i këtij problemi: .
    Vlerat e y i dhe x i =1...n janë të njohura për ne, këto janë të dhëna vëzhgimi. Në funksionin S ato janë konstante. Variablat në këtë funksion janë vlerësimet e kërkuara të parametrave - , . Për të gjetur minimumin e një funksioni prej 2 ndryshoresh, është e nevojshme të llogariten derivatet e pjesshme të këtij funksioni në lidhje me secilin prej parametrave dhe t'i barazojmë me zero, d.m.th. .
    Si rezultat, marrim një sistem prej 2 ekuacionesh normale lineare:
    Duke zgjidhur këtë sistem, gjejmë vlerësimet e kërkuara të parametrave:

    Korrektësia e llogaritjes së parametrave të ekuacionit të regresionit mund të kontrollohet duke krahasuar shumat (disa mospërputhje është e mundur për shkak të rrumbullakimit të llogaritjeve).
    Për të llogaritur vlerësimet e parametrave, mund të ndërtoni Tabelën 1.
    Shenja e koeficientit të regresionit b tregon drejtimin e marrëdhënies (nëse b > 0, marrëdhënia është e drejtpërdrejtë, nëse b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
    Formalisht, vlera e parametrit a është vlera mesatare e y për x e barabartë me zero. Nëse faktori i shenjës nuk ka dhe nuk mund të ketë një vlerë zero, atëherë interpretimi i mësipërm i parametrit a nuk ka kuptim.

    Vlerësimi i ngushtësisë së marrëdhënies ndërmjet veçorive kryhet duke përdorur koeficientin e korrelacionit të çiftit linear - r x,y . Mund të llogaritet duke përdorur formulën: . Për më tepër, koeficienti i korrelacionit të çiftit linear mund të përcaktohet në terma të koeficientit të regresionit b: .
    Gama e vlerave të lejuara të koeficientit linear të korrelacionit të çiftit është nga -1 në +1. Shenja e koeficientit të korrelacionit tregon drejtimin e marrëdhënies. Nëse r x, y >0, atëherë lidhja është e drejtpërdrejtë; nëse r x, y<0, то связь обратная.
    Nëse ky koeficient është afër unitetit në modul, atëherë marrëdhënia midis veçorive mund të interpretohet si një lidhje lineare mjaft e ngushtë. Nëse moduli i tij është i barabartë me një ê r x, y ê =1, atëherë lidhja ndërmjet veçorive është funksionale lineare. Nëse tiparet x dhe y janë linearisht të pavarura, atëherë r x,y është afër 0.
    Tabela 1 mund të përdoret gjithashtu për të llogaritur r x,y.

    Tabela 1

    N vëzhgimex iy ix i ∙ y i
    1 x 1y 1x 1 y 1
    2 x2y2x 2 y 2
    ...
    nx ny nx n y n
    Shuma e kolonës∑x∑y∑x y
    Mesatarja
    Për të vlerësuar cilësinë e ekuacionit të regresionit të marrë, llogaritet koeficienti teorik i përcaktimit - R 2 yx:

    ,
    ku d 2 është varianca y e shpjeguar nga ekuacioni i regresionit;
    e 2 - varianca e mbetur (e pashpjegueshme nga ekuacioni i regresionit) y ;
    s 2 y - varianca totale (totali) y .
    Koeficienti i përcaktimit karakterizon pjesën e variacionit (dispersionit) të veçorisë që rezulton y, e shpjeguar me regresion (dhe, rrjedhimisht, faktorin x), në variacionin total (dispersionin) y. Koeficienti i përcaktimit R 2 yx merr vlera nga 0 në 1. Prandaj, vlera 1-R 2 yx karakterizon proporcionin e variancës y të shkaktuar nga ndikimi i faktorëve të tjerë që nuk merren parasysh në model dhe gabimet e specifikimit.
    Me regresion linear të çiftëzuar R 2 yx =r 2 yx .

    Publikime të ngjashme