הערכת המובהקות הסטטיסטית של משוואת הרגרסיה של הפרמטרים שלה. אומדן רמות המובהקות של מקדמי משוואת הרגרסיה

לאחר מציאת המשוואה רגרסיה לינארית, נאמדת המשמעות הן של המשוואה בכללותה והן של הפרמטרים האישיים שלה.

בדוק את המשמעות של משוואת הרגרסיה - אמצעי לקבוע אם מודל מתמטי, המבטאים את הקשר בין משתנים, נתונים ניסויים והאם יש מספיק משתנים מסבירים (אחד או יותר) הכלולים במשוואה כדי לתאר את המשתנה התלוי.

בדיקת מובהקות מבוססת על ניתוח שונות.

על פי רעיון ניתוח השונות, הסכום הכולל של סטיות בריבוע (RMS) של y מהערך הממוצע מפורק לשני חלקים - מוסבר ובלתי מוסבר:

או, בהתאמה:

יש כאן שני מקרי קיצון: כאשר סך סטיית התקן שווה בדיוק לשארית וכאשר סטיית התקן הכוללת שווה לפקטוריאלית.

במקרה הראשון, גורם ה-x אינו משפיע על התוצאה, כל השונות של y נובעת מהשפעת גורמים אחרים, קו הרגרסיה מקביל לציר Ox, והמשוואה אמורה להיראות כך.

במקרה השני, גורמים אחרים אינם משפיעים על התוצאה, y קשור ל-x מבחינה תפקודית, וסטיית התקן השיורית היא אפס.

עם זאת, בפועל שני המונחים נמצאים בצד ימין. ההתאמה של קו הרגרסיה לחיזוי תלויה בכמה מהשונות הכוללת ב-y אחראית השונות המוסברת. אם ה-RMSD המוסבר גדול מה-RMSD השיורי, אז משוואת הרגרסיה מובהקת סטטיסטית ולגורם x יש השפעה מובהקת על תוצאת y. זה שווה ערך לעובדה שמקדם הקביעה יתקרב לאחדות.

מספר דרגות החופש (df-דרגות חופש) הוא מספר ערכי תכונה משתנים באופן בלתי תלוי.

סטיית התקן הכוללת דורשת (n-1) סטיות עצמאיות,

לסטיית התקן הפקטוריאלית יש דרגת חופש אחת, ו

כך נוכל לכתוב:

מאיזון זה, אנו קובעים כי = n-2.

על ידי חלוקת כל סטיית תקן במספר דרגות החופש שלה, נקבל את הריבוע הממוצע של הסטיות, או השונות לדרגת חופש אחת: - השונות הכוללת, - פקטוריאלית, - שיורית.

אָנָלִיזָה מובהקות סטטיסטיתמקדמי רגרסיה ליניאריים

למרות הערכים התיאורטיים של מקדמי המשוואה קשר ליניארימניחים שהם קבועים, האומדנים a ו-b של מקדמים אלה, המתקבלים במהלך בניית המשוואה מנתוני מדגם אקראי, הם משתנים אקראיים. אם יש לשגיאות הרגרסיה התפלגות נורמלית, אז גם האומדנים של המקדמים מחולקים בצורה נורמלית וניתן לאפיין אותם בערכים הממוצעים והשונות שלהם. לכן, ניתוח המקדמים מתחיל בחישוב המאפיינים הללו.

שונות המקדמים מחושבים על ידי הנוסחאות:

שונות של מקדם הרגרסיה:

איפה הפיזור השיורי לכל דרגת חופש אחת.

פיזור פרמטרים:

לפיכך, השגיאה הסטנדרטית של מקדם הרגרסיה נקבעת על ידי הנוסחה:

השגיאה הסטנדרטית של הפרמטר נקבעת על ידי הנוסחה:

הם משמשים לבדיקת השערות אפס לפיהן הערך האמיתי של מקדם הרגרסיה b או יירוט a הוא אפס: .

להשערה החלופית יש את הצורה: .

לסטטיסטיקה t יש התפלגות t-תלמידים עם דרגות חופש. לפי טבלאות החלוקה של Student, ברמת מובהקות מסוימת b ודרגות חופש נמצא ערך קריטי.

אם, אם כן, יש לדחות את השערת האפס, המקדמים נחשבים מובהקים סטטיסטית.

אם, אז לא ניתן לדחות את השערת האפס. (אם מקדם b אינו מובהק סטטיסטית, המשוואה צריכה להיראות כך, וזה אומר שאין קשר בין התכונות. אם מקדם a אינו מובהק סטטיסטית, מומלץ להעריך את המשוואה החדשה בטופס).

הערכות מקדם מרווחים משוואה לינאריתרגרסיות:

רווח סמך עבורא: .

רווח סמך עבורב:

המשמעות היא שעם מהימנות נתונה (היכן היא רמת המובהקות), הערכים האמיתיים של a, b נמצאים במרווחים המצוינים.

למקדם הרגרסיה יש פרשנות כלכלית ברורה, ולכן גבולות הסמך של המרווח לא צריכים להכיל תוצאות לא עקביות, למשל, הם לא צריכים לכלול אפס.

ניתוח המובהקות הסטטיסטית של המשוואה כולה.

התפלגות פישר בניתוח רגרסיה

הערכת המובהקות של משוואת הרגרסיה בכללותה ניתנת באמצעות מבחן F של פישר. במקרה זה, מוצעת השערת האפס שכל מקדמי הרגרסיה, למעט האיבר החופשי a, שווים לאפס, ולכן, גורם x אינו משפיע על התוצאה y (או).

הערך של F - קריטריון קשור למקדם הקביעה. מתי רגרסיה מרובה:

כאשר m הוא מספר המשתנים הבלתי תלויים.

מתי רגרסיה זוגיתנוסחה F - סטטיסטיקה לובשת את הצורה:

כשמוצאים את הערך הטבלאי של קריטריון F, נקבעת רמת מובהקות (בדרך כלל 0.05 או 0.01) ושתי דרגות חופש: - במקרה של רגרסיה מרובה, - עבור רגרסיה זוגית.

אם, אזי נדחה ומתגבשת מסקנה לגבי מובהקות הקשר הסטטיסטי בין y ל-x.

אם, אז ההסתברות של משוואת הרגרסיה הנחשבת לא מובהקת סטטיסטית אינה נדחית.

תגובה. ברגרסיה ליניארית זוגית. כמו כן, לכן. לפיכך, בדיקת ההשערות לגבי המובהקות של מקדמי הרגרסיה והמתאם מקבילה לבדיקת ההשערה לגבי המובהקות של משוואת הרגרסיה הליניארית.

ניתן להשתמש בהתפלגות פישר לא רק כדי לבדוק את ההשערה שכל מקדמי הרגרסיה הליניאריים שווים לאפס בו זמנית, אלא גם את ההשערה שחלק מהמקדמים הללו שווים לאפס. זה חשוב בפיתוח מודל רגרסיה ליניארית, שכן הוא מאפשר להעריך את התוקף של אי הכללת משתנים בודדים או קבוצות שלהם ממספר המשתנים המסבירים, או להיפך, הכללתם במספר זה.

נניח, למשל, הרגרסיה הליניארית המרובה נאמדה תחילה עבור n תצפיות עם m משתנים מסבירים, ומקדם הקביעה שווה, ואז ה-k המשתנים האחרונים אינם נכללים מרשימת המשתנים המסבירים, והמשוואה שעבורה מקדם של הקביעה היא (, כי (כל משתנה נוסף מסביר חלק, קטן ככל שיהיה, מהשונות במשתנה התלוי).

על מנת לבדוק את ההשערה לגבי השוויון בו זמנית לאפס של כל המקדמים עם משתנים שלא נכללו, הערך מחושב

בעל הפצת פישר עם דרגות חופש.

לפי טבלאות החלוקה של פישר, ברמת מובהקות נתונה, הם מוצאים. ואם, אז השערת האפס נדחית. במקרה זה, אין זה נכון להוציא את כל K המשתנים מהמשוואה.

ניתן לבצע נימוקים דומים לגבי התוקף של הכללת אחד או יותר k משתנים מסבירים חדשים במשוואת הרגרסיה.

במקרה זה מחושב F - סטטיסטיקה

בעל הפצה. ואם הוא חורג מרמה קריטית, אז הכללת משתנים חדשים מסבירה חלק משמעותי מהשונות הבלתי מוסברת בעבר של המשתנה התלוי (כלומר, הכללת משתנים מסבירים חדשים מוצדקת).

הערות. 1. רצוי לכלול משתנים חדשים אחד בכל פעם.

2. לחישוב F - סטטיסטיקה, כאשר בוחנים הכללת משתנים מסבירים במשוואה, רצוי לשקול את מקדם הקביעה המותאם למספר דרגות החופש.

F - סטטיסטיקה של פישר משמשת גם לבדיקת ההשערה לגבי צירוף המקרים של משוואות הרגרסיה עבור קבוצות בודדות של תצפיות.

שיהיו 2 דגימות המכילות, בהתאמה, תצפיות. עבור כל אחת מהדגימות הללו, משוואת רגרסיית המינים הוערכה. תן לסטיית התקן מקו הרגרסיה (כלומר) להיות שווה עבורם, בהתאמה, .

נבדקת השערת האפס: שכל המקדמים התואמים של המשוואות הללו שווים זה לזה, כלומר. משוואת הרגרסיה עבור הדגימות הללו זהה.

אפשר להעריך את משוואת הרגרסיה מאותו סוג עבור כל התצפיות בבת אחת, ו-RMS.

ואז F מחושב - סטטיסטיקה לפי הנוסחה:

יש לו הפצת פישר עם דרגות חופש. F - הסטטיסטיקה תהיה קרובה לאפס אם המשוואה עבור שתי הדגימות זהה, כי במקרה הזה. הָהֵן. אם, אז השערת האפס מתקבלת.

אם, אז השערת האפס נדחית, ולא ניתן לבנות משוואת רגרסיה אחת.

ניתוח רגרסיה הוא שיטת מחקר סטטיסטית המאפשרת להראות את התלות של פרמטר במשתנה בלתי תלוי אחד או יותר. בעידן שלפני המחשב, השימוש בו היה די קשה, במיוחד כשמדובר בכמויות גדולות של נתונים. היום, לאחר שלמדת כיצד לבנות רגרסיה באקסל, אתה יכול לפתור בעיות סטטיסטיות מורכבות תוך מספר דקות בלבד. להלן דוגמאות קונקרטיותמתחום הכלכלה.

סוגי רגרסיה

המושג עצמו הוכנס למתמטיקה ב-1886. רגרסיה מתרחשת:

  • ליניארי;
  • פרבולי;
  • כּוֹחַ;
  • אקספוננציאלי;
  • היפרבולי;
  • הַפגָנָתִי;
  • לוגריתמי.

דוגמה 1

קחו בחשבון את הבעיה של קביעת התלות של מספר חברי הצוות בדימוס בשכר הממוצע ב-6 מפעלי תעשייה.

משימה. שישה ארגונים ניתחו את הממוצע החודשי שכרומספר העובדים שהתפטרו רצון עצמי. בצורת טבלה יש לנו:

מספר האנשים שעזבו

שכר

30000 רובל

35000 רובל

40000 רובל

45000 רובל

50000 רובל

55000 רובל

60000 רובל

לבעיה של קביעת התלות של מספר העובדים המתפטרים בשכר הממוצע ב-6 מפעלים, למודל הרגרסיה יש צורה של המשוואה Y = a 0 + a 1 x 1 +...+a k x k , כאשר x i הם המשתנים המשפיעים , a i הם מקדמי הרגרסיה, a k הוא מספר הגורמים.

עבור משימה זו, Y הוא המדד לעובדים שעזבו, והגורם המשפיע הוא השכר, אותו אנו מציינים ב-X.

שימוש ביכולות של הגיליון האלקטרוני "אקסל"

יש להקדים לניתוח רגרסיה באקסל יישום של פונקציות מובנות על הנתונים הטבלאיים הזמינים. עם זאת, למטרות אלו, עדיף להשתמש בתוסף השימושי מאוד "ערכת כלי ניתוח". כדי להפעיל אותו אתה צריך:

  • מהכרטיסייה "קובץ", עבור לקטע "אפשרויות";
  • בחלון שנפתח, בחר את השורה "תוספות";
  • לחץ על כפתור "עבור" הממוקם בתחתית, מימין לשורה "ניהול";
  • סמן את התיבה לצד השם "חבילת ניתוח" ואשר את הפעולות שלך על ידי לחיצה על "אישור".

אם הכל נעשה כהלכה, הכפתור הרצוי יופיע בצד ימין של לשונית הנתונים, הממוקמת מעל גיליון העבודה של Excel.

באקסל

כעת, כשיש לנו בהישג יד את כל הכלים הווירטואליים הדרושים לביצוע חישובים אקונומטריים, אנו יכולים להתחיל לפתור את הבעיה שלנו. לזה:

  • לחץ על כפתור "ניתוח נתונים";
  • בחלון שנפתח, לחץ על כפתור "רגרסיה";
  • בלשונית שמופיעה, הזן את טווח הערכים עבור Y (מספר העובדים שעזבו) ועבור X (השכר שלהם);
  • אנו מאשרים את הפעולות שלנו על ידי לחיצה על כפתור "אישור".

כתוצאה מכך, התוכנית תתמלא אוטומטית עלה חדשניתוח רגרסיה של נתונים בגיליון אלקטרוני. הערה! ל- Excel יש את היכולת להגדיר באופן ידני את המיקום המועדף עליך למטרה זו. לדוגמה, זה יכול להיות אותו גיליון שבו נמצאים ערכי Y ו-X, או אפילו ספר חדש, תוכנן במיוחד לאחסון נתונים כאלה.

ניתוח תוצאות רגרסיה עבור ריבוע R

באקסל, הנתונים שהתקבלו במהלך עיבוד הנתונים של הדוגמה הנחשבת נראים כך:

קודם כל, כדאי לשים לב לערך של ריבוע ה-R. זה מקדם הקביעה. בדוגמה זו, ריבוע R = 0.755 (75.5%), כלומר הפרמטרים המחושבים של המודל מסבירים את הקשר בין הפרמטרים הנחשבים ב-75.5%. ככל שהערך של מקדם הקביעה גבוה יותר, כך המודל הנבחר ישים יותר עבור משימה מסוימת. הוא האמין שהוא מתאר נכון את המצב האמיתי עם ערך ריבוע R מעל 0.8. אם ריבוע R<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

ניתוח יחס

המספר 64.1428 מראה מה יהיה הערך של Y אם כל המשתנים xi במודל שאנו שוקלים מוגדרים לאפס. במילים אחרות, ניתן לטעון שערכו של הפרמטר המנותח מושפע גם מגורמים אחרים שאינם מתוארים במודל מסוים.

המקדם הבא -0.16285, הממוקם בתא B18, מראה את משקל ההשפעה של משתנה X על Y. המשמעות היא שהשכר החודשי הממוצע של העובדים במסגרת המודל הנבדק משפיע על מספר המתפטרים במשקל של -0.16285, כלומר. מידת השפעתו בכלל קטנה. הסימן "-" מציין שלמקדם יש ערך שלילי. זה ברור, שכן כולם יודעים שככל שהשכר במפעל גבוה יותר, כך פחות מביעים רצון לסיים את חוזה העבודה או להתפטר.

רגרסיה מרובה

מונח זה מתייחס למשוואת חיבור עם מספר משתנים בלתי תלויים של הצורה:

y \u003d f (x 1 + x 2 + ... x m) + ε, כאשר y היא התכונה האפקטיבית (משתנה תלוי), ו-x 1, x 2, ... x m הם גורמי הגורמים (משתנים בלתי תלויים).

הערכת פרמטר

עבור רגרסיה מרובה (MR) היא מתבצעת בשיטת הריבועים הקטנים ביותר (OLS). עבור משוואות לינאריות בצורה Y = a + b 1 x 1 +...+b m x m + ε, אנו בונים מערכת של משוואות נורמליות (ראה להלן)

כדי להבין את עיקרון השיטה, שקול את המקרה הדו-גורמי. אז יש לנו מצב המתואר על ידי הנוסחה

מכאן נקבל:

כאשר σ היא השונות של התכונה המתאימה המשתקפת באינדקס.

LSM ישים למשוואת MP בקנה מידה ניתן לסטנדרטיזציה. במקרה זה, נקבל את המשוואה:

כאשר t y , t x 1, … t xm הם משתנים סטנדרטיים שעבורם הערכים הממוצעים הם 0; β i הם מקדמי רגרסיה מתוקננים, וסטיית התקן היא 1.

שימו לב שכל ה-β i במקרה זה מוגדרים כמנורמלים וריכוזיים, ולכן ההשוואה ביניהם נחשבת נכונה וקבילה. בנוסף, נהוג לסנן גורמים, ולהשליך את אלה עם הערכים הקטנים ביותר של βi.

בעיה בשימוש במשוואת רגרסיה לינארית

נניח שקיימת טבלה של דינמיקת המחירים של מוצר מסוים N במהלך 8 החודשים האחרונים. יש צורך לקבל החלטה על כדאיות רכישת האצווה שלה במחיר של 1850 רובל/ט.

מספר חודש

שם חודש

מחיר פריט N

1750 רובל לטון

1755 רובל לטון

1767 רובל לטון

1760 רובל לטון

1770 רובל לטון

1790 רובל לטון

1810 רובל לטון

1840 רובל לטון

כדי לפתור בעיה זו בגיליון האלקטרוני של Excel, עליך להשתמש בכלי ניתוח הנתונים המוכר כבר מהדוגמה לעיל. לאחר מכן, בחר בקטע "רגרסיה" והגדר את הפרמטרים. יש לזכור שבשדה "מרווח קלט Y" יש להזין טווח ערכים עבור המשתנה התלוי (במקרה זה, מחיר הסחורה בחודשים ספציפיים בשנה), וב"מרווח קלט X" - עבור המשתנה הבלתי תלוי (מספר חודש). אשר את הפעולה על ידי לחיצה על "אישור". בגיליון חדש (אם צוין כך), אנו מקבלים נתונים עבור רגרסיה.

על בסיסם, אנו בונים משוואה לינארית בצורה y=ax+b, כאשר הפרמטרים a ו-b הם המקדמים של הישר עם שם מספר החודש והמקדמים וקו "צומת Y" מתוך גיליון עם התוצאות ניתוח רגרסיה. לפיכך, משוואת הרגרסיה הליניארית (LE) עבור בעיה 3 כתובה כך:

מחיר מוצר N = 11.714* מספר חודש + 1727.54.

או בסימון אלגברי

y = 11.714 x + 1727.54

ניתוח תוצאות

כדי להחליט אם משוואת הרגרסיה הליניארית שהתקבלה היא נאותה, נעשה שימוש במקדמי מתאם מרובים (MCC) ומקדמי קביעה, כמו גם במבחן של פישר ובמבחן של Student. בטבלת האקסל עם תוצאות רגרסיה, הם מופיעים תחת השמות של מספר R, R-squad, F-statistic ו-t-statistic, בהתאמה.

KMC R מאפשרת להעריך את אטימות הקשר ההסתברותי בין המשתנים הבלתי תלויים והתלויים. ערכו הגבוה מצביע על קשר חזק למדי בין המשתנים "מספר החודש" ו"מחיר הסחורה N ברובל לטון אחד". עם זאת, אופי הקשר הזה נותר לא ידוע.

ריבוע מקדם הקביעה R 2 (RI) הוא מאפיין מספרי של חלק הפיזור הכולל ומראה את הפיזור של איזה חלק מנתוני הניסוי, כלומר. ערכי המשתנה התלוי תואמים את משוואת הרגרסיה הליניארית. בבעיה הנבדקת, ערך זה שווה ל-84.8%, כלומר, הנתונים הסטטיסטיים מתוארים ברמת דיוק גבוהה על ידי ה-SD שהושג.

סטטיסטיקה F, הנקראת גם מבחן פישר, משמשת להערכת המובהקות של קשר ליניארי, המפריכה או מאששת את השערת קיומו.

(קריטריון התלמיד) עוזר להעריך את המשמעות של המקדם עם מונח לא ידוע או חופשי של קשר ליניארי. אם הערך של קריטריון t > t cr, אזי השערת חוסר המשמעות של האיבר החופשי של המשוואה הליניארית נדחית.

בבעיה הנבדקת עבור האיבר הפנוי, באמצעות כלי האקסל, התקבל כי t = 169.20903, ו-p = 2.89Е-12, כלומר יש לנו סבירות אפס שההשערה הנכונה לגבי חוסר המשמעות של האיבר הפנוי תהיה נִדחֶה. עבור המקדם ב-t=5.79405 לא ידוע, ו-p=0.001158. במילים אחרות, ההסתברות שההשערה הנכונה לגבי חוסר המשמעות של המקדם עבור הלא נודע תידחה היא 0.12%.

לפיכך, ניתן לטעון שמשוואת הרגרסיה הליניארית שהתקבלה היא נאותה.

בעיית הכדאיות של קניית גוש מניות

רגרסיה מרובה באקסל מתבצעת באמצעות אותו כלי ניתוח נתונים. שקול בעיה יישומית ספציפית.

על הנהלת NNN לקבל החלטה לגבי כדאיות רכישת 20% ממניות MMM SA. עלות החבילה (JV) היא 70 מיליון דולר. מומחי NNN אספו נתונים על עסקאות דומות. הוחלט להעריך את שווי גוש המניות לפי פרמטרים כאלה, המבוטאים במיליוני דולרים, כמו:

  • חשבונות לתשלום (VK);
  • מחזור שנתי (VO);
  • חשבונות חייבים (VD);
  • עלות רכוש קבוע (SOF).

בנוסף, נעשה שימוש בפרמטר פיגורי שכר של המיזם (V3 P) באלפי דולרים.

פתרון באמצעות גיליון אלקטרוני של אקסל

קודם כל, אתה צריך ליצור טבלה של נתונים ראשוניים. זה נראה כמו זה:

  • קרא לחלון "ניתוח נתונים";
  • בחר בקטע "רגרסיה";
  • בתיבה "מרווח קלט Y" הזן את טווח הערכים של משתנים תלויים מעמודה G;
  • לחץ על הסמל עם חץ אדום מימין לחלון "מרווח קלט X" ובחר את טווח כל הערכים מהעמודות B, C, D, F בגיליון.

בחר "גיליון עבודה חדש" ולחץ על "אישור".

קבל את ניתוח הרגרסיה עבור הבעיה הנתונה.

בחינת התוצאות והמסקנות

"אנו אוספים" מהנתונים המעוגלים שהוצגו לעיל בגיליון האלקטרוני של Excel, את משוואת הרגרסיה:

SP \u003d 0.103 * SOF + 0.541 * VO - 0.031 * VK + 0.405 * VD + 0.691 * VZP - 265.844.

בצורה מתמטית מוכרת יותר, ניתן לכתוב זאת כך:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

נתונים עבור JSC "MMM" מוצגים בטבלה:

אם מחליפים אותם במשוואת הרגרסיה, הם מקבלים נתון של 64.72 מיליון דולר אמריקאי. המשמעות היא שאסור לרכוש את המניות של JSC MMM, שכן ערכן של 70 מיליון דולר אמריקאי מוגזם למדי.

כפי שניתן לראות, השימוש בגיליון האקסל ובמשוואת הרגרסיה אפשרו לקבל החלטה מושכלת לגבי כדאיות עסקה מאוד ספציפית.

עכשיו אתה יודע מהי רגרסיה. הדוגמאות באקסל שנדונו לעיל יעזרו לכם לפתור בעיות מעשיות מתחום האקונומטריה.

במחקר סוציו-אקונומי, לעתים קרובות צריך לעבוד באוכלוסייה מצומצמת, או עם נתונים סלקטיביים. לכן, לאחר הפרמטרים המתמטיים של משוואת הרגרסיה, יש צורך להעריך אותם ואת המשוואה כולה עבור מובהקות סטטיסטית, כלומר. יש צורך לוודא שהמשוואה המתקבלת והפרמטרים שלה נוצרים בהשפעת גורמים לא אקראיים.

קודם כל, המובהקות הסטטיסטית של המשוואה בכללותה מוערכת. ההערכה מתבצעת בדרך כלל באמצעות מבחן F של פישר. החישוב של קריטריון F מבוסס על כלל הוספת השונות. כלומר, השונות הכללית סימן-תוצאה = שונות גורם + שונות שיורית.

המחיר האמיתי

מחיר תיאורטי
לאחר בניית משוואת הרגרסיה, ניתן לחשב את הערך התיאורטי של תוצאת הסימן, כלומר. מחושב על ידי משוואת הרגרסיה תוך התחשבות בפרמטרים שלה.

ערכים אלו יאפיינו את תוצאת הסימן שנוצרת בהשפעת הגורמים הכלולים בניתוח.

תמיד יש פערים (שאריות) בין הערכים האמיתיים של תכונת התוצאה לאלו המחושבים על בסיס משוואת הרגרסיה, עקב השפעתם של גורמים אחרים שלא נכללו בניתוח.

ההבדל בין הערכים התיאורטיים והממשיים של תוצאת התכונה נקרא שיוריים. וריאציה כללית של תכונה-תוצאה:

השונות בתכונה-תוצאה, עקב השונות בתכונות הגורמים הנכללים בניתוח, נאמדת באמצעות השוואה של הערכים התיאורטיים של התוצאה. תכונה והערכים הממוצעים שלה. וריאציה שיורית באמצעות השוואה של ערכים תיאורטיים וממשיים של התכונה המתקבלת. לשונות הכוללת, לשארית ולממשית יש מספר שונה של דרגות חופש.

כללי, פ- מספר יחידות באוכלוסייה הנחקרת

מַמָשִׁי, פ- מספר הגורמים הנכללים בניתוח

שְׂרִידִי

מבחן F של פישר מחושב כיחס ל , ומחושב עבור דרגת חופש אחת.

השימוש במבחן F של פישר כאומדן של המובהקות הסטטיסטית של משוואת רגרסיה הוא הגיוני מאוד. היא התוצאה. תכונה, עקב הגורמים הכלולים בניתוח, כלומר. זהו היחס של התוצאה המוסברת. סִימָן. - זוהי (וריאציה) של סימן התוצאה עקב גורמים שהשפעתם אינה נלקחת בחשבון, כלומר. לא נכלל בניתוח.

זֶה. קריטריון F נועד להעריך בעל משמעותעודף מעל . אם הוא נמוך באופן לא משמעותי מ-, ואף יותר מכך אם הוא חורג מ-, לכן, הניתוח אינו כולל את אותם גורמים שמשפיעים באמת על תכונת התוצאה.

מבחן F של פישר מוצג בטבלה, הערך בפועל מושווה לטבלה. אם , אז משוואת הרגרסיה נחשבת מובהקת סטטיסטית. אם, להיפך, המשוואה אינה מובהקת סטטיסטית ולא ניתן להשתמש בה בפועל, מובהקות המשוואה כולה מצביעה על המובהקות הסטטיסטית של מדדי המתאם.

לאחר הערכת המשוואה בכללותה, יש צורך להעריך את המובהקות הסטטיסטית של הפרמטרים של המשוואה. אומדן זה נעשה באמצעות סטטיסטיקת ה-t של Student. סטטיסטיקת ה-t מחושבת כיחס בין פרמטרי המשוואה (מודולו) לשגיאת הריבוע הממוצעת שלהם. אם מוערך מודל של גורם אחד, אזי מחושבים 2 סטטיסטיקות.

בכל תוכנות המחשב, החישוב של שגיאת התקן וסטטיסטיקת t עבור הפרמטרים מתבצע עם חישוב הפרמטרים עצמם. סטטיסטיקות T מוצגות בטבלה. אם הערך הוא , אז הפרמטר נחשב מובהק סטטיסטית, כלומר. נוצר בהשפעת גורמים לא אקראיים.

חישוב סטטיסטיקת ה-t משמעו בעצם בדיקת השערת האפס לפיה הפרמטר אינו מובהק, כלומר. השוויון שלו לאפס. עם מודל של גורם אחד, 2 השערות מוערכות: ו

רמת המובהקות של קבלת השערת האפס תלויה ברמת רמת הביטחון המקובלת. אז אם החוקר מציין רמת הסתברות של 95%, רמת מובהקות הקבלה תחושב, לכן, אם רמת המובהקות ≥ 0.05, אז היא מתקבלת והפרמטרים נחשבים לא מובהקים סטטיסטית. אם , אזי החלופה נדחית ומתקבלת: ו.

חבילות היישום הסטטיסטיות מספקות גם רמת מובהקות לקבלת השערות אפס. הערכה של המשמעות של משוואת הרגרסיה והפרמטרים שלה יכולה לתת התוצאות הבאות:

ראשית, המשוואה כולה היא מובהקת (לפי מבחן F) וכל הפרמטרים של המשוואה גם הם מובהקים סטטיסטית. המשמעות היא שניתן להשתמש במשוואה המתקבלת הן לצורך קבלת החלטות ניהוליות והן לצורך חיזוי.

שנית, לפי קריטריון F, המשוואה מובהקת סטטיסטית, אך לפחות אחד מהפרמטרים של המשוואה אינו מובהק. ניתן להשתמש במשוואה כדי לקבל החלטות ניהוליות לגבי הגורמים המנותחים, אך לא ניתן להשתמש בה לחיזוי.

שלישית, המשוואה אינה מובהקת סטטיסטית, או שהמשוואה מובהקת על פי קריטריון F, אך כל הפרמטרים של המשוואה המתקבלת אינם מובהקים. לא ניתן להשתמש במשוואה לכל מטרה.

על מנת שמשוואת הרגרסיה תוכר כמודל של הקשר בין התכונה-תוצאה לתכונות-הגורמים, יש צורך שהיא תכלול את כל הגורמים החשובים ביותר הקובעים את התוצאה, כך שהפירוש המשמעותי של המשוואה פרמטרים תואמים את הקשרים המוצדקים תיאורטית בתופעה הנחקרת. מקדם הקביעה R 2 חייב להיות > 0.5.

בעת בנייה משוואה מרובהרגרסיה, רצוי לבצע הערכה לפי מה שנקרא מקדם הקביעה המותאם (R 2). הערך של R 2 (כמו גם מתאמים) עולה עם עלייה במספר הגורמים הנכללים בניתוח. ערך המקדמים מוערך במיוחד בתנאים של אוכלוסיות קטנות. על מנת להשתלם השפעה רעה R 2 ומתאמים מתוקנים למספר דרגות החופש, כלומר. מספר האלמנטים המשתנים באופן חופשי כאשר גורמים מסוימים כלולים.

מקדם קביעה מתוקן

פ-הגדר גודל/מספר תצפיות

ק- מספר הגורמים הנכללים בניתוח

n-1הוא מספר דרגות החופש

(1-R2)- הערך של השונות השיורית/בלתי מוסברת של התכונה המתקבלת

תמיד פחות R2. על בסיס, אפשר להשוות את ההערכות של המשוואות עם מספר שונהנותחו גורמים.

34. בעיות בלימוד סדרות זמן.

סדרות של דינמיקה נקראות סדרות זמן או סדרות זמן. סדרה דינמית היא רצף של אינדיקטורים לפי סדר זמן המאפיינים תופעה מסוימת (נפח התמ"ג בין 90 ל-98 שנים). מטרת לימוד סדרת הדינמיקה היא לזהות דפוסים בהתפתחות התופעה הנחקרת (המגמה המרכזית) ולחזות על בסיס זה. מההגדרה של RD עולה שכל סדרה מורכבת משני אלמנטים: זמן t ורמת הסדרה (הערכים הספציפיים של המחוון שעל בסיסם בנויה סדרת DR). סדרות DR יכולות להיות 1) רגעיות - סדרות, שהאינדיקטורים שלהן קבועים בנקודת זמן, בתאריך מסוים, 2) מרווח - סדרות, שהאינדיקטורים שלהן מתקבלים לפרק זמן מסוים (1. אוכלוסיית סנט פטרבורג, 2. תוצר לתקופה). חלוקת הסדרה לרגעים ומרווחים היא הכרחית, מכיוון שזה קובע את הפרטים של החישוב של כמה אינדיקטורים של סדרת DR. סיכום רמה סדרת מרווחיםנותן תוצאה מפורשת בצורה משמעותית, שלא ניתן לומר על סיכום הרמות של סדרת הרגעים, מאחר שהאחרונות מכילות ספירה חוזרת. הבעיה הכי חשובהבניתוח סדרות זמן נמצאת בעיית ההשוואה של רמות הסדרה. הרעיון הזה הוא מאוד תכליתי. הרמות צריכות להיות ניתנות להשוואה מבחינת שיטות חישוב ומבחינת שטח וכיסוי יחידות אוכלוסייה. אם סדרת DR בנויה במונחים של עלות, אז יש להציג או לחשב את כל הרמות במחירים דומים. בעת בניית סדרות מרווחים, הרמות צריכות לאפיין את אותם פרקי זמן. בעת בניית מומנט סדרה D, יש לקבוע את הרמות באותו תאריך. השורות יכולות להיות שלמות או לא שלמות. סדרות לא שלמות משמשות בפרסומים רשמיים (1980,1985,1990,1995,1996,1997,1998,1999...). ניתוח מורכב RD כולל את המחקר ברגעים הבאים:

1. חישוב אינדיקטורים לשינויים ברמות RD

2. חישוב אינדיקטורים ממוצעים של RD

3. זיהוי המגמה המרכזית של הסדרה, בניית דגמי טרנדים

4. אומדן אוטוקורלציה ב-RD, בניית מודלים אוטורגרסיביים

5. מתאם של RD

6. חיזוי RD.

35. אינדיקטורים לשינוי ברמות סדרות הזמן .

בְּ השקפה כללית RowD יכול להיות מיוצג:

y היא רמת DR, t הוא הרגע או פרק הזמן שאליו מתייחסת הרמה (המחוון), n הוא אורך סדרת DR (מספר תקופות). כאשר לומדים סדרה של דינמיקה, מחושבים האינדיקטורים הבאים: 1. צמיחה מוחלטת, 2. גורם צמיחה (קצב צמיחה), 3. האצה, 4. גורם צמיחה (קצב צמיחה), 5. ערך מוחלט של צמיחה של 1%. האינדיקטורים המחושבים יכולים להיות: 1. שרשרת - מתקבלת על ידי השוואת כל רמה בסדרה עם הרמה הקודמת, 2. בסיסית - מתקבלת על ידי השוואה לרמה שנבחרה כבסיס ההשוואה (אלא אם צוין אחרת, הרמה הראשונה של הסדרה נלקח כבסיס). 1. שרשרת רווחים מוחלטים:. מראה כמה יותר או פחות. מרווחים מוחלטים של שרשרת נקראים אינדיקטורים של קצב השינוי ברמות של הסדרה הדינמית. בסיס צמיחה מוחלטת: . אם רמות הסדרה הן אינדיקטורים יחסיים, המבוטאים ב-%, הרי שהעלייה המוחלטת מתבטאת בנקודות שינוי. 2. גורם צמיחה (קצב צמיחה):הוא מחושב כיחס בין רמות הסדרה לאלו הקודמות מיד (מקדמי צמיחה של שרשרת), או לרמה שנלקחת כבסיס ההשוואה (מקדמי צמיחה בסיסיים): . מאפיין כמה פעמים כל רמה בסדרה > או< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. על בסיס צמיחה אבסולוטית, המדד מחושב - האצת צמיחה מוחלטת: . האצה היא הצמיחה המוחלטת של גידולים מוחלטים. מעריך כיצד ההגדלות עצמן משתנות, אם הן יציבות או מואצות (הולכות וגדלות). 4. קצב צמיחההוא היחס בין הצמיחה לבסיס ההשוואה. לידי ביטוי %: ; . קצב הצמיחה הוא קצב הצמיחה מינוס 100%. מראה כמה % רמת השורה הזו היא > או< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. חישוב מדדים ממוצעים של RD חשב את הרמות הממוצעות של הסדרה, הרווחים המוחלטים הממוצעים, קצב הצמיחה הממוצע וקצב הצמיחה הממוצע. אינדיקטורים ממוצעים מחושבים על מנת לסכם מידע וכדי להיות מסוגל להשוות בין הרמות והאינדיקטורים לשינוי שלהם בסדרות שונות. 1. רמת שורה ממוצעתא) עבור סדרות זמן מרווחים הוא מחושב לפי הממוצע האריתמטי הפשוט: , כאשר n הוא מספר הרמות בסדרת הזמן; ב) עבור סדרות רגעים, הרמה הממוצעת מחושבת לפי נוסחה ספציפית, הנקראת ממוצע כרונולוגי: . 2. עלייה מוחלטת ממוצעתמחושב על בסיס מרווחים מוחלטים של שרשרת לפי הממוצע האריתמטי פשוט:

. 3. קצב צמיחה ממוצעמחושב על בסיס מקדמי גדילה של השרשרת באמצעות נוסחת הממוצע הגיאומטרי:. כאשר מעירים על האינדיקטורים הממוצעים של סדרת DR, יש צורך לציין 2 נקודות: התקופה המאפיינת את המדד המנותח ומרווח הזמן עבורו בנויה סדרת DR. 4. קצב צמיחה ממוצע: . 5. קצב צמיחה ממוצע: .


הערכת המובהקות הסטטיסטית של הפרמטרים ושל המשוואה בכללותה היא הליך חובה המאפשר לתת קלט לגבי האפשרות להשתמש במשוואת הקשר הבנויה לצורך קבלת החלטות ניהוליות וחיזוי.

הערכת המובהקות הסטטיסטית של משוואת הרגרסיה מתבצעת באמצעות מבחן פישר F, שהוא היחס בין השונות הפקטוראלית והשיורית המחושבים לדרגת חופש אחת.

שונות גורמים היא החלק המוסבר של השונות של התכונה-תוצאה, כלומר בשל השונות של אותם גורמים הכלולים בניתוח (במשוואה):

כאשר k הוא מספר הגורמים במשוואת הרגרסיה (מספר דרגות החופש של הפיזור הפקטוריאלי); - הערך הממוצע של המשתנה התלוי; - ערך תיאורטי (מחושב לפי משוואת הרגרסיה) של המשתנה התלוי עבור היחידה ה-i של האוכלוסייה.

שונות שיורית היא החלק הבלתי מוסבר של השונות בתוצאה, כלומר, עקב שונות בגורמים אחרים שאינם נכללים בניתוח.

= , (71)

כאשר - הערך בפועל של המשתנה התלוי y i - היחידה של האוכלוסייה; n-k-1 הוא מספר דרגות החופש של הפיזור השיורי; n הוא נפח האוכלוסייה.

סכום הגורם והשונות השיוריות, כפי שצוין לעיל, הוא השונות הכוללת של תכונת התוצאה.

מבחן F של פישר מחושב באמצעות הנוסחה הבאה:

מבחן F של פישר - ערך המשקף את היחס בין השונות המוסברת והלא מוסברת, מאפשר לענות על השאלה: האם הגורמים הנכללים בניתוח מסבירים חלק מובהק סטטיסטית מהווריאציה של התוצאה-תכונה. מבחן ה-F של פישר מוצג בטבלה (הקלט לטבלה הוא מספר דרגות החופש של הגורם ושונות שיוריות). אם , אז משוואת הרגרסיה מוכרת כמובהקת סטטיסטית ובהתאם, מקדם הקביעה מובהק סטטיסטית. אחרת, המשוואה אינה מובהקת סטטיסטית, כלומר. אינו מסביר חלק משמעותי מהווריאציה של התכונה-תוצאה.

אומדן המובהקות הסטטיסטית של פרמטרי המשוואה מתבצעת על בסיס סטטיסטיקת t, המחושבת כיחס בין המודולוס של פרמטרי משוואת הרגרסיה לשגיאות הסטנדרטיות שלהם ( ):

, איפה ; (73)

, איפה . (74)

בכל תוכנית סטטיסטית, חישוב הפרמטרים תמיד מלווה בחישוב שגיאות הסטנדרטיות (הממוצע-ריבוע) שלהם וסטטיסטיקות ה-t. הפרמטר מוכר כמשמעותי סטטיסטית אם הערך האמיתי של סטטיסטיקת ה-t גדול מהערך הטבלאי.

אומדן פרמטרים המבוססים על סטטיסטיקת t, במהותה, היא מבחן של השערת האפס לגבי השוויון של הפרמטרים הכלליים לאפס (H 0: =0; H 0: =0;), כלומר, לגבי חוסר המשמעות של הפרמטרים של משוואת הרגרסיה. רמת המובהקות של קבלת השערות אפס = 1-0.95=0.05 (0.95 היא רמת ההסתברות, ככלל, שנקבעה בחישובים כלכליים). אם רמת המובהקות המחושבת נמוכה מ-0.05, אזי השערת האפס נדחית ומתקבלת החלופה - לגבי המובהקות הסטטיסטית של הפרמטר.

על ידי הערכת המובהקות הסטטיסטית של משוואת הרגרסיה והפרמטרים שלה, נוכל לקבל שילוב שונה של תוצאות.

· משוואה לפי מבחן F היא מובהקת סטטיסטית וכל הפרמטרים של המשוואה לפי סטטיסטיקה t גם הם מובהקים סטטיסטית. ניתן להשתמש במשוואה זו הן לקבלת החלטות ניהוליות (על אילו גורמים יש להשפיע על מנת להשיג את התוצאה הרצויה), והן לניבוי התנהגות תכונת התוצאה עבור ערכים מסוימים של הגורמים.

· לפי קריטריון F, המשוואה מובהקת סטטיסטית, אך חלק מהפרמטרים של המשוואה אינם מובהקים. ניתן להשתמש במשוואה לקבלת החלטות ניהוליות (בנוגע לאותם גורמים שעבורם אושרה המובהקות הסטטיסטית של השפעתם), אך לא ניתן להשתמש במשוואה לצורך חיזוי.

· משוואת מבחן F אינה מובהקת סטטיסטית. לא ניתן להשתמש במשוואה. יש להמשיך בחיפוש אחר סימנים-גורמים משמעותיים או צורה אנליטית של קשר בין טיעונים לתגובה.

אם המובהקות הסטטיסטית של המשוואה והפרמטרים שלה מאושרת, אז ניתן ליישם את מה שנקרא תחזית נקודתית, כלומר. הערך הסביר של תוצאת התכונה (y) מחושב עבור ערכים מסוימים של הגורמים (x). ברור למדי שהערך החזוי של המשתנה התלוי לא יעלה בקנה אחד עם ערכו האמיתי. זה קשור, קודם כל, לעצם התלות בקורלציה. יחד עם זאת, התוצאה מושפעת מגורמים רבים, שרק חלק מהם יכול להילקח בחשבון במשוואת היחס. בנוסף, צורת החיבור בין התוצאה לגורמים (סוג משוואת הרגרסיה) עלולה להיבחר בצורה לא נכונה. תמיד יש הבדל בין הערכים האמיתיים של תוצאת התכונה לבין הערכים התיאורטיים (התחזית) שלה ( ). מבחינה גרפית, מצב זה מתבטא בכך שלא כל הנקודות של שדה המתאם שוכנות על קו הרגרסיה. רק עם חיבור פונקציונלי, קו הרגרסיה יעבור בכל הנקודות של שדה המתאם. ההבדל בין הערכים האמיתיים והתיאורטיים של התכונה המתקבלת נקרא סטיות או שגיאות, או שאריות. בהתבסס על ערכים אלו, מחושבת השונות השיורית, שהיא אומדן של השגיאה הריבועית הממוצעת של משוואת הרגרסיה. הערך של שגיאת התקן משמש לחישוב רווחי הסמך עבור הערך החזוי של תכונת התוצאה (Y).

לאחר הערכת הפרמטרים או ב, קיבלנו משוואת רגרסיה שבאמצעותה נוכל להעריך את הערכים yעַל להגדיר ערכים איקס. טבעי להניח שהערכים המחושבים של המשתנה התלוי לא יהיו בקנה אחד עם הערכים בפועל, שכן קו הרגרסיה מתאר את הקשר רק בממוצע, באופן כללי. משמעויות נפרדות מפוזרות סביבו. לפיכך, המהימנות של הערכים המחושבים המתקבלים ממשוואת הרגרסיה נקבעת במידה רבה על ידי פיזור הערכים הנצפים סביב קו הרגרסיה. בפועל, ככלל, שונות השגיאה אינה ידועה והיא נאמדת מהתצפיות בו-זמנית עם פרמטרי הרגרסיה. או ב. הגיוני להניח שהאומדן קשור לסכום הריבועים של שיירי הרגרסיה. הכמות היא אומדן מדגם של שונות ההפרעות הכלולות במודל התיאורטי . ניתן להראות כי עבור מודל רגרסיה זוגי

היכן היא הסטייה של הערך בפועל של המשתנה התלוי מערכו המחושב.

אם , אז עבור כל התצפיות הערכים האמיתיים של המשתנה התלוי עולים בקנה אחד עם הערכים המחושבים (התיאורטיים) . מבחינה גרפית, זה אומר שקו הרגרסיה התיאורטי (הקו שנבנה מהפונקציה) עובר בכל נקודות שדה המתאם, מה שמתאפשר רק בחיבור פונקציונלי למהדרין. לכן, הסימן היעיל בְּ-לחלוטין בשל השפעת הגורם איקס.

בדרך כלל, בפועל, יש פיזור מסוים של נקודות שדה המתאם ביחס לקו הרגרסיה התיאורטי, כלומר סטיות של נתונים אמפיריים מהתיאורטיים. פיזור זה נובע הן מהשפעת הגורם איקס, כלומר נְסִיגָה yעַל איקס, (שונות כזו נקראת מוסברת, מכיוון שהיא מוסברת על ידי משוואת הרגרסיה), ופעולה של סיבות אחרות (שונות בלתי מוסברת, אקראית). גודל הסטיות הללו עומד בבסיס חישוב מדדי האיכות של המשוואה.

לפי העיקרון הבסיסי של ניתוח השונות, הסכום הכולל של הסטיות בריבוע של המשתנה התלוי yמהערך הממוצע ניתן לפרק לשני מרכיבים: מוסבר על ידי משוואת הרגרסיה ובלתי מוסבר:

,

איפה - ערכים y, מחושב על ידי המשוואה .

בוא נמצא את היחס בין סכום הסטיות בריבוע, המוסבר על ידי משוואת הרגרסיה, לסכום הכולל של הריבועים:

, איפה

. (7.6)

היחס בין חלק השונות המוסבר על ידי משוואת הרגרסיה לבין השונות הכוללת של התכונה המתקבלת נקרא מקדם הקביעה. הערך לא יכול לעלות על אחד והערך המרבי הזה יושג רק ב , כלומר. כאשר כל סטייה היא אפס ולכן כל נקודות הפיזור שוכנות בדיוק על קו ישר.

מקדם הקביעה מאפיין את חלקה של השונות המוסברת על ידי הרגרסיה בערך הכולל של השונות של המשתנה התלוי . בהתאם, הערך מאפיין את פרופורציית השונות (פיזור) י,לא מוסבר על ידי משוואת הרגרסיה, ולכן נגרמת על ידי השפעת גורמים אחרים שלא נלקחו בחשבון במודל. ככל שיהיה קרוב יותר לאחד, כך איכות הדגם גבוהה יותר.



עם רגרסיה ליניארית זוגית, מקדם הקביעה שווה לריבוע של הזוג מקדם ליניארימתאמים: .

השורש של מקדם קביעה זה הוא המקדם (אינדקס) של מתאם מרובה, או יחס המתאם התיאורטי.

על מנת לגלות האם ערך מקדם הקביעה שהושג במהלך הערכת הרגרסיה באמת משקף את הקשר האמיתי בין yו איקסלבדוק את המשמעות של המשוואה הבנויה כמכלול ופרמטרים בודדים. בדיקת מובהקות של משוואת הרגרסיה מאפשרת לברר האם משוואת הרגרסיה מתאימה לשימוש מעשי, למשל לחיזוי או לא.

במקביל, מובאת ההשערה העיקרית לגבי חוסר המשמעות של המשוואה בכללותה, מה שמצמצם באופן פורמלי להשערה שפרמטרי הרגרסיה שווים לאפס, או, מה שכן, שמקדם הקביעה שווה לאפס: . השערה חלופית לגבי מובהקות המשוואה היא ההשערה שפרמטרי הרגרסיה אינם שווים לאפס או שמקדם הקביעה אינו שווה לאפס: .

כדי לבדוק את המשמעות של מודל הרגרסיה, השתמש F-הקריטריון של פישר, מחושב כיחס בין סכום הריבועים (לכל משתנה בלתי תלוי אחד) לסכום השיורי של הריבועים (לדרגת חופש אחת):

, (7.7)

איפה קהוא מספר המשתנים הבלתי תלויים.

לאחר חלוקת המונה והמכנה של היחס (7.7) בסכום הכולל של הסטיות בריבוע של המשתנה התלוי, F-ניתן לבטא את הקריטריון באופן שווה במונחים של המקדם:

.

אם השערת האפס נכונה, אז השונות המוסברת על ידי משוואת הרגרסיה והשונות הבלתי מוסברת (השיורית) אינן שונות זו מזו.

ערך מוערך F-הקריטריון מושווה לערך קריטי התלוי במספר המשתנים הבלתי תלויים ק, ועל מספר דרגות החופש (n-k-1). ערך טבלה (קריטי). F-קריטריון - זהו הערך המקסימלי של יחס השונות, שיכול להתרחש אם הם מתפצלים באופן אקראי עבור רמת הסתברות נתונה להימצאות השערת אפס. אם הערך המחושב F-הקריטריון גדול יותר מהטבלאי ברמת מובהקות נתונה, אז נדחית השערת האפס לגבי היעדר קשר ונגבשת מסקנה לגבי המשמעות של קשר זה, כלומר. המודל נחשב משמעותי.

עבור מודל רגרסיה מזווג

.

ברגרסיה ליניארית, בדרך כלל נאמדת המשמעות של לא רק של המשוואה בכללותה, אלא גם של המקדמים האישיים שלה. לשם כך, השגיאה הסטנדרטית של כל אחד מהפרמטרים נקבעת. שגיאות סטנדרטיותמקדמי רגרסיה של פרמטרים נקבעים על ידי הנוסחאות:

, (7.8)

(7.9)

שגיאות תקן של מקדמי רגרסיה או סטיות תקן המחושבות בנוסחאות (7.8,7.9), ככלל, ניתנות בתוצאות החישוב של מודל הרגרסיה בחבילות סטטיסטיות.

בהתבסס על השגיאות הריבועיות הממוצעות של מקדמי הרגרסיה, המובהקות של מקדמים אלה נבדקת באמצעות הסכמה הרגילה לבדיקת השערות סטטיסטיות.

כהשערה עיקרית, מובאת השערה לגבי הבדל לא משמעותי מאפס של מקדם הרגרסיה ה"אמיתי". השערה חלופית במקרה זה היא ההשערה ההפוכה, כלומר, פרמטר הרגרסיה "האמיתי" אינו שווה לאפס. השערה זו נבדקת באמצעות t-סטטיסטיקה שיש ט-הפצת תלמידים:

ואז הערכים המחושבים t-נתונים סטטיסטיים מושווים לערכים קריטיים t-נתונים סטטיסטיים שנקבעו מטבלאות התפלגות של הסטודנטים. ערך קריטינקבע בהתאם לרמת המובהקות α ומספר דרגות החופש, כלומר (n-k-1), n-מספר תצפיות ק- מספר משתנים בלתי תלויים. במקרה של רגרסיה של זוג ליניארי, מספר דרגות החופש הוא (פ- 2). ניתן לחשב את הערך הקריטי גם במחשב באמצעות פונקציית STUDISP המובנית של Excel.

אם הערך המחושב t-הסטטיסטיקה גדולה מקריטית, אז ההשערה העיקרית נדחית ומאמינים שעם הסתברות (1-α)מקדם הרגרסיה "האמיתי" שונה משמעותית מאפס, שהוא אישור סטטיסטי לקיומה של תלות ליניארית של המשתנים המתאימים.

אם הערך המחושב t-הסטטיסטיקה פחות מקריטית, אז אין סיבה לדחות את ההשערה העיקרית, כלומר, מקדם הרגרסיה "האמיתי" אינו שונה באופן משמעותי מאפס ברמת המובהקות α . במקרה זה, יש להוציא מהמודל את הגורם המתאים למקדם זה.

ניתן לקבוע את המשמעות של מקדם הרגרסיה על ידי בניית רווח סמך. רווח סמך לפרמטרי רגרסיה או במוגדר כדלקמן:

,

,

היכן נקבע מטבלת ההתפלגות של התלמיד עבור רמת המובהקות α ומספר דרגות החופש (פ- 2) לרגרסיה זוגית.

מכיוון שלמקדמי רגרסיה במחקרים אקונומטריים יש פרשנות כלכלית ברורה, רווחי סמך לא צריכים להכיל אפס. הערך האמיתי של מקדם הרגרסיה אינו יכול להכיל בו זמנית ערכים חיוביים ושליליים, כולל אפס, אחרת אנו מקבלים תוצאות סותרות בפרשנות הכלכלית של המקדמים, מה שלא יכול להיות. לפיכך, המקדם משמעותי אם המתקבל מרווח ביטחוןלא מכסה אפס.

דוגמה 7.4.לפי דוגמה 7.1:

א) בנה מודל רגרסיה ליניארי מזווג של תלות הרווח ממכירות ב מחיר המכירהבאמצעות תוכנת עיבוד נתונים.

ב) העריכו את המשמעות של משוואת הרגרסיה בכללותה, באמצעות F-הקריטריון של פישר ב α=0.05.

ג) העריכו את המובהקות של מקדמי מודל הרגרסיה באמצעות ט-קריטריון התלמיד עבור α=0.05ו α=0.1.

לניתוח רגרסיה אנו משתמשים בתוכנת המשרד הרגילה EXCEL. נבנה מודל רגרסיה באמצעות הכלי REGRESSION של הגדרות ANALYSIS PACKAGE (איור 7.5), המופעל באופן הבא:

ServiceData AnalysisREGRESSIONOK.

איור.7.5. שימוש בכלי REGRESSION

בתיבת הדו-שיח REGRESSION, בשדה מרווח קלט Y, הזן את הכתובת של טווח התאים המכילים את המשתנה התלוי. בשדה מרווח קלט X, הזן את הכתובות של טווח אחד או יותר המכילים ערכים של משתנים בלתי תלויים. תיבת הסימון התוויות בשורה הראשונה מוגדרת למצב פעיל אם כותרות העמודות נבחרות גם כן. על איור. 7.6. מוצגת צורת המסך של חישוב מודל הרגרסיה באמצעות הכלי REGRESSION.

אורז. 7.6. בניית מודל רגרסיה מזווג באמצעות

כלי REGRESSION

כתוצאה מהעבודה של הכלי REGRESSION, נוצר פרוטוקול ניתוח הרגרסיה הבא (איור 7.7).

אורז. 7.7. פרוטוקול ניתוח רגרסיה

המשוואה לתלות הרווח ממכירות במחיר המכירה היא בצורה:

נאמוד את המשמעות של משוואת הרגרסיה באמצעות F-הקריטריון של פישר. מַשְׁמָעוּת F-הקריטריון של פישר נלקח מהטבלה" ניתוח שונות» פרוטוקול EXCEL (איור 7.7). ערך מוערך F-קריטריון 53,372. ערך טבלה F-קריטריון ברמת מובהקות α=0.05ומספר דרגות החופש הוא 4.964. כי , אז המשוואה נחשבת משמעותית.

ערכים משוערים ט-הקריטריונים של התלמיד למקדמי משוואת הרגרסיה ניתנים בטבלה המתקבלת (איור 7.7). ערך טבלה ט-מבחן תלמיד ברמת המובהקות α=0.05ו-10 דרגות חופש זה 2.228. עבור מקדם הרגרסיה א, ומכאן המקדם אלא משמעותי. עבור מקדם הרגרסיה בלכן, המקדם במשמעותי.

פרסומים קשורים