ניתן למצוא את הערך הקריטי t של הקריטריון מהטבלה. התפלגות מבחן t של תלמיד לבדיקת השערת הממוצע וחישוב רווח הסמך ב- MS Excel

בדיקת השערה סטטיסטית מאפשרת להגיע למסקנה קפדנית לגבי מאפייני האוכלוסייה הכללית על סמך נתוני מדגם. השערות שונות. אחת מהן היא ההשערה לגבי הממוצע (ציפייה מתמטית). המהות שלו היא להגיע למסקנה נכונה לגבי היכן הממוצע הכללי יכול או לא להתבסס רק על המדגם הזמין (לעולם לא נדע את האמת המדויקת, אבל נוכל לצמצם את מעגל החיפוש).

הגישה הכללית לבדיקת השערות מתוארת, כל כך ישר לעניין. נניח תחילה שהמדגם נלקח מקבוצה נורמלית של משתנים אקראיים איקסעם ממוצע כללי μ ופיזור σ2(אני יודע, אני יודע שזה לא קורה, אבל אתה לא צריך להפריע לי!). הממוצע האריתמטי של מדגם זה הוא כמובן משתנה מקרי. אם נחלץ מדגמים רבים כאלה ונחשב את הממוצעים עבורם, אז יהיה להם גם עם הציפייה המתמטית μ ו

ואז המשתנה האקראי

נשאלת השאלה: האם הממוצע הכללי עם הסתברות של 95% יהיה בטווח של ±1.96 s x̅. במילים אחרות, הן ההתפלגות של משתנים אקראיים

שווה ערך.

בפעם הראשונה שאלה זו הועלתה (ונפתרה) על ידי כימאי שעבד במפעל הבירה גינס בדבלין (אירלנד). שמו של הכימאי היה ויליאם סילי גוסט, והוא לקח דגימות בירה לניתוח כימי. בשלב מסוים, ככל הנראה, החלו לוויליאם ספקות מעורפלים לגבי התפלגות הממוצעים. התברר שהוא קצת יותר מפוזר ממה שהתפלגות רגילה צריכה להיות.

לאחר שאסף הצדקה מתמטית וחישב את ערכי פונקציית ההפצה שגילה, כתב הכימאי מדבלין וויליאם גוסט פתק שהתפרסם בגיליון מרץ 1908 של כתב העת Biometrics (עורך ראשי - קארל פירסון) . כי גינס אסרה בהחלט למסור את סודות הבישול, גוסט חתם תחת השם הבדוי Student.

למרות העובדה שק' פירסון כבר המציא את ההפצה, עם זאת, הרעיון הכללי של נורמליות עדיין שלט. אף אחד לא היה חושב שההתפלגות של הערכות מדגם עשויה להיות לא נורמלית. לכן, המאמר של וו. גוסט נותר כמעט ללא תשומת לב ונשכח. ורק רונלד פישר העריך את הגילוי של גוסט. פישר השתמש בתפוצה החדשה ביצירתו והעניק לה את השם התפלגות t של תלמיד. הקריטריון לבדיקת השערות, בהתאמה, הפך מבחן t של תלמיד. אז הייתה "מהפכה" בסטטיסטיקה, שנכנסה לעידן של ניתוח נתוני מדגם. זו הייתה סטייה קצרה אל ההיסטוריה.

בוא נראה מה W. Gosset יכול היה לראות. בואו ניצור 20 אלף דגימות נורמליות מ-6 תצפיות עם ממוצע ( איקס) 50 וסטיית תקן ( σ ) 10. לאחר מכן אנו מנרמלים את אמצעי המדגם באמצעות שונות כללית:

אנו מקבצים את 20 אלף הממוצעים המתקבלים למרווחים באורך 0.1 ומחשבים את התדרים. הבה נשרטט את התפלגות התדר בפועל (נורמה) ותיאורטית (ENorm) של אמצעי המדגם על דיאגרמה.

הנקודות (תדרים נצפים) כמעט חופפות לקו (תדרים תיאורטיים). זה מובן, כי הנתונים לקוחים מאותה אוכלוסייה כללית, וההבדלים הם רק טעויות דגימה.

בואו נעשה ניסוי חדש. אנו מנרמלים את הממוצעים באמצעות שונה במדגם.

בואו נספור שוב את התדרים ונתווה אותם בתרשים כנקודות, ונשאיר את הקו של ההתפלגות הנורמלית הסטנדרטית להשוואה. הבה נסמן את התדירות האמפירית של הממוצעים, נניח, דרך המכתב ט.

ניתן לראות שההתפלגות הפעם לא מאוד דומות. קרוב, כן, אבל לא אותו דבר. זנבות הפכו ל"כבדים" יותר.

ל-Gosset-Student לא היה הגרסה העדכנית ביותר MS Excel, אבל זה האפקט שהוא הבחין בו. למה זה כך? ההסבר הוא שהמשתנה האקראי

תלוי לא רק בטעות הדגימה (מונה), אלא גם בטעות הסטנדרטית של הממוצע (המכנה), שהיא גם משתנה אקראי.

בואו להבין קצת איזה סוג של הפצה צריך להיות עבור כזה משתנה רנדומלי. ראשית, עליך לזכור (או ללמוד) משהו מסטטיסטיקה מתמטית. יש משפט פישר כזה, שאומר שבמדגם מהתפלגות נורמלית:

1. בינוני איקסושונות מדגם s2הן כמויות עצמאיות;

2. ליחס בין המדגם לבין השונות הכללית, כפול מספר דרגות החופש, יש התפלגות χ 2(צ'י ריבוע) עם אותו מספר של דרגות חופש, כלומר.

איפה ק- מספר דרגות החופש (באנגלית degrees of freedom (d.f.))

תוצאות רבות אחרות בסטטיסטיקה של מודלים רגילים מבוססות על חוק זה.

נחזור להתפלגות הממוצע. מחלקים את המונה והמכנה של הביטוי

על σX̅. לקבל

המונה הוא משתנה אקראי רגיל רגיל (נסמן ξ (שי)). ניתן לבטא את המכנה ממשפט פישר.

ואז הביטוי המקורי יקבל את הצורה

זה מה שיש בפנים השקפה כללית(יחס התלמיד). כבר אפשר לגזור את פונקציית ההפצה שלו ישירות, כי ההתפלגות של שני המשתנים האקראיים בביטוי זה ידועות. בואו נשאיר את התענוג הזה למתמטיקאים.

לפונקציית התפלגות ה-t של Student יש נוסחה שדי קשה להבנה, ולכן אין טעם לנתח אותה. בכל מקרה, אף אחד לא משתמש בזה, כי. ההסתברויות ניתנות בטבלאות מיוחדות של התפלגות סטודנט (הנקראות לפעמים טבלאות של מקדמי סטודנט), או שהן מקובצות בנוסחאות PC.

אז, חמוש בידע חדש, תוכל להבין את ההגדרה הרשמית של ההפצה של Student.
משתנה אקראי המציית להתפלגות התלמיד עם קדרגות חופש הן היחס בין משתנים אקראיים בלתי תלויים

איפה ξ מופץ על פי החוק הרגיל המקובל, ו χ 2kנתון להפצה χ 2ג קדרגות חופש.

לפיכך, הנוסחה לקריטריון התלמיד לממוצע האריתמטי

יש מקרה מיוחדיחסי סטודנטים

מהנוסחה ומההגדרה עולה כי התפלגות מבחן ה-t של הסטודנט תלויה רק ​​במספר דרגות החופש.

בְּ ק> 30 מבחן t למעשה אינו שונה מההתפלגות הנורמלית הסטנדרטית.

שלא כמו צ'י ריבוע, מבחן ה-t יכול להיות חד או שני זנב. בדרך כלל משתמשים בדו צדדי, בהנחה שהסטייה יכולה להתרחש בשני הכיוונים מהממוצע. אבל אם מצב הבעיה מאפשר סטייה רק ​​בכיוון אחד, אז סביר ליישם קריטריון חד צדדי. זה מגדיל מעט את הכוח, tk. ברמת מובהקות קבועה, הערך הקריטי מתקרב מעט לאפס.

תנאים ליישום מבחן t של סטודנט

למרות העובדה שהתגלית של Student ביצעה מהפכה בסטטיסטיקה, מבחן ה-t עדיין מוגבל בתחולתו, מכיוון עצמו נובע מהנחה של התפלגות נורמלית של הנתונים המקוריים. אם הנתונים אינם תקינים (וזה בדרך כלל המקרה), אז למבחן t לא תהיה יותר התפלגות Student. עם זאת, בשל פעולתו של משפט הגבול המרכזי, הממוצע, אפילו עבור נתונים לא נורמליים, מקבל במהירות התפלגות בצורת פעמון.

קחו למשל נתונים שיש להם הטיה בולטת ימינה, כמו התפלגות צ'י מרובעת עם 5 דרגות חופש.

עכשיו בואו ניצור 20 אלף דגימות ונראה כיצד התפלגות האמצעים משתנה בהתאם לגודלם.

ההבדל ניכר למדי בדגימות קטנות עד 15-20 תצפיות. אבל אז זה נעלם מהר. לפיכך, החריגות של ההתפלגות היא, כמובן, לא טובה, אבל לא קריטית.

יותר מכל, קריטריון ה-t "מפחד" מחריגות, כלומר. סטיות חריגות. בואו ניקח 20 אלף דגימות נורמליות של 15 תצפיות ונוסיף חריג אקראי אחד לחלק מהן.

התמונה לא מרוצה. התדרים בפועל של הממוצעים שונים מאוד מהתיאורטיים. השימוש בהפצת t במצב כזה הופך להיות משימה מסוכנת מאוד.

לכן, בדגימות לא קטנות במיוחד (מ-15 תצפיות), מבחן ה-t עמיד יחסית להתפלגות הלא נורמלית של הנתונים הראשוניים. אבל חריגים בנתונים מעוותים מאוד את התפלגות מבחן ה-t, אשר, בתורו, עלול להוביל לשגיאות הסקה סטטיסטיות, ולכן יש לבטל תצפיות חריגות. לעתים קרובות, כל הערכים הנופלים מחוץ ל-±2 סטיות תקן מהממוצע מוסרים מהמדגם.

דוגמה לבדיקת השערת תוחלת מתמטית באמצעות מבחן t של Student ב- MS Excel

לאקסל יש מספר פונקציות הקשורות להפצת t. בואו נתחשב בהם.

STUDENT.DIST - התפלגות t של Student צדדית "קלאסית". הקלט הוא הערך של קריטריון t, מספר דרגות החופש והאפשרות (0 או 1) שקובעת מה צריך לחשב: הצפיפות או הערך של הפונקציה. בפלט, נקבל, בהתאמה, את הצפיפות או ההסתברות שהמשתנה האקראי יהיה קטן מקריטריון ה-t שצוין בארגומנט.

STUDENT.DIST.2X - הפצה דו כיוונית. הערך המוחלט (מודולו) של קריטריון t ומספר דרגות החופש ניתנים כטיעון. בפלט, אנו מקבלים את ההסתברות לקבל את זה או משהו אחר יותר ערך t-test, כלומר. רמת מובהקות בפועל (p-level).

STUDENT.DIST.RH - הפצת t ימני. אז, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PX(2;5) = 0.05097. אם מבחן ה-t חיובי, ההסתברות המתקבלת היא רמת p.

STUDENT.INV - משמש לחישוב ההדדיות השמאלית של התפלגות ה-t. הטיעון הוא ההסתברות ומספר דרגות החופש. בפלט, נקבל את הערך של קריטריון t המתאים להסתברות זו. ההסתברות נספרת שמאלה. לכן, יש צורך ברמת המובהקות עצמה עבור הזנב השמאלי α , ולימין 1 - α .

STUDENT.ORD.2X היא ההדדית של התפלגות הסטודנט הדו-זנבית, כלומר. ערך מבחן t (מודולו). רמת המובהקות ניתנת גם כקלט. α . רק שהפעם, הספירה לאחור היא משני הצדדים בו זמנית, כך שההסתברות מתחלקת על שני זנבות. אז STUDENT.OBR (1-0.025; 5) \u003d STUDENT. OBR. 2X (0.05; 5) \u003d 2.57058

STUDENT.TEST - פונקציה לבדיקת השערת השוויון ציפיות מתמטיותבשתי דוגמאות. מחליף חבורה של חישובים, כי. מספיק לציין רק שני טווחים עם נתונים ועוד כמה פרמטרים. הפלט הוא p-level.

STUDENT CONFIDENCE - חישוב רווח הסמך של הממוצע, תוך התחשבות בהתפלגות ה-t.

קחו זאת בחשבון מקרה בוחן. החברה אורזת מלט בשקיות של 50 ק"ג. עקב מקרה, בשקית בודדת מותרת סטייה מסוימת מהמסה הצפויה, אך הממוצע הכללי צריך להישאר 50 ק"ג. מחלקת בקרת האיכות שקלה באקראי 9 שקיות וקיבלה התוצאות הבאות: מסה ממוצעת ( איקס) הסתכם ב-50.3 ק"ג, סטיית תקן (ס) - 0.5 ק"ג.

האם התוצאה תואמת את השערת האפס שהממוצע הכללי הוא 50 ק"ג? במילים אחרות, האם ניתן להגיע לתוצאה כזו במקרה טהור, אם הציוד עובד כמו שצריך ומייצר מילוי ממוצע של 50 ק"ג? אם ההשערה לא נדחית, אז ההבדל המתקבל מתאים לטווח התנודות האקראיות, אך אם ההשערה נדחית, אז, ככל הנראה, התרחש כשל בהגדרות המנגנון שממלא את השקיות. צריך לבדוק ולהתאים.

מצב קצר בסימון המקובל נראה כך.

H0: μ = 50 ק"ג

H1: μ ≠ 50 ק"ג

יש סיבות להניח שחלוקת תפוסת התיקים היא לפי חלוקה נורמלית (או שאינה שונה ממנה בהרבה). לכן, כדי לבדוק את ההשערה של תוחלת מתמטית, אתה יכול להשתמש במבחן t של Student. סטיות אקראיות יכולות להתרחש בכל כיוון, ולכן יש צורך במבחן t דו-זנבתי.

ראשית, אנו מיישמים אמצעים אנטי-דילוביים: חישוב ידני של מבחן ה-t והשוואתו עם ערך טבלה קריטי. מבחן t משוער:

כעת בואו נקבע אם המספר המתקבל חורג מהרמה הקריטית ברמת המובהקות α = 0.05. הבה נשתמש בטבלת התפלגות הסטודנטים (הזמינה בכל ספר לימוד בסטטיסטיקה).

העמודות מציגות את ההסתברות של הצד הימני של ההתפלגות, השורות מציגות את מספר דרגות החופש. אנו מעוניינים במבחן t דו-צדדי עם רמת מובהקות של 0.05, המקבילה לערך t עבור מחצית מרמת המובהקות מימין: 1 - 0.05 / 2 = 0.975. מספר דרגות החופש הוא גודל המדגם מינוס 1, כלומר. 9 - 1 = 8. בצומת נמצא את הערך הטבלאי של מבחן ה-t - 2.306. אם היינו משתמשים בתקן התפלגות נורמלית, אז הנקודה הקריטית תהיה 1.96, אבל כאן זה יותר, כי להפצת t על דגימות קטנות יש צורה שטוחה יותר.

אנו משווים את הערך בפועל (1.8) ואת הערך הטבלאי (2.306). הקריטריון המחושב התברר כפחות מזה הטבלה. לכן, הנתונים הזמינים אינם סותרים את השערת H 0 לפיה הממוצע הכללי הוא 50 ק"ג (אך גם לא מוכיחים זאת). זה כל מה שאנחנו יכולים לגלות באמצעות הטבלאות. אתה, כמובן, עדיין יכול לנסות למצוא רמת p, אבל זה יהיה משוער. וככלל, P-level משמש לבדיקת השערות. אז בואו נעבור לאקסל.

אין פונקציה מוכנה לחישוב מבחן ה-t באקסל. אבל זה לא מפחיד, כי נוסחת ה-t-test של Student היא די פשוטה וניתן לבנות אותה בקלות ממש בתא אקסל.

קיבלתי את אותו 1.8. תחילה נמצא את הערך הקריטי. אנחנו לוקחים אלפא 0.05, הקריטריון הוא דו-צדדי. אנו זקוקים לפונקציה של הערך ההפוך של התפלגות t עבור ההשערה הדו-זנבית STUDENT.OBR.2X.

הערך המתקבל מנתק את האזור הקריטי. מבחן ה-t הנצפה אינו נופל לתוכו, ולכן ההשערה אינה נדחית.

עם זאת, זוהי אותה דרך לבדיקת השערה עם ערך טבלה. זה יהיה יותר אינפורמטיבי לחשב את רמת ה-p, כלומר. ההסתברות לקבל את הסטייה הנצפית או אפילו יותר גדולה מהממוצע של 50 ק"ג אם השערה זו נכונה. תזדקק לפונקציית התפלגות Student עבור ההשערה הדו-זנבית STUDENT.DIST.2X.

רמת P היא 0.1096, וזה יותר רמה מקובלתמובהקות של 0.05 - איננו דוחים את ההשערה. אבל עכשיו אנחנו יכולים לשפוט את מידת הראיות. רמת P התבררה כדי קרובה לרמה כאשר ההשערה נדחית, וזה מוביל למחשבות שונות. לדוגמה, שהמדגם היה קטן מכדי לזהות סטייה משמעותית.

נניח שאחרי זמן מה שוב החליטה מחלקת הבקרה לבדוק כיצד נשמר תקן מילוי השקיות. הפעם, לאמינות רבה יותר, נבחרו לא 9, אלא 25 תיקים. ברור אינטואיטיבית שפריסת הממוצע תקטן, ולכן הסיכוי למצוא כשל במערכת הולך וגדל.

נניח שאותם ערכים של הממוצע וסטיית התקן עבור המדגם התקבלו כמו בפעם הראשונה (50.3 ו-0.5, בהתאמה). בוא נחשב את מבחן ה-t.


הערך הקריטי עבור 24 דרגות חופש ו-α = 0.05 הוא 2.064. התמונה למטה מראה שמבחן ה-t נופל לאזור של דחיית ההשערה.

ניתן להסיק שעם הסתברות ביטחון של יותר מ-95%, הממוצע הכללי שונה מ-50 ק"ג. כדי להיות משכנע יותר, בואו נסתכל על רמת p (השורה האחרונה בטבלה). ההסתברות לקבל ממוצע עם סטייה זו או אפילו גדולה יותר מ-50, אם ההשערה נכונה, היא 0.0062, או 0.62%, דבר שהוא כמעט בלתי אפשרי במדידה בודדת. באופן כללי, אנו דוחים את ההשערה כבלתי סבירה.

חישוב רווח סמך באמצעות חלוקת t של תלמיד

שיטה סטטיסטית נוספת הקשורה קשר הדוק לבדיקת השערות היא חישוב רווחי סמך. אם הערך המתאים להשערת האפס נופל במרווח המתקבל, אז זה שווה ערך לעובדה שהשערת האפס אינה נפסלת. אחרת, ההשערה נדחית ברמת הביטחון המתאימה. במקרים מסוימים, אנליסטים אינם בודקים השערות כלל צורה קלאסית, אלא רק לחשב רווחי סמך. גישה זו מאפשרת לך לחלץ מידע שימושי עוד יותר.

הבה נחשב את רווחי הסמך עבור הממוצע ב-9 ו-25 תצפיות. בשביל זה אנחנו משתמשים פונקציית אקסלאמון. תלמיד. כאן, למרבה הפלא, הכל די פשוט. בארגומנטים של הפונקציה, עליך לציין רק את רמת המובהקות α , סטיית תקן מדגם וגודל מדגם. בפלט נקבל את חצי הרוחב של רווח הסמך, כלומר הערך שצריך להפריש משני צידי הממוצע. לאחר ביצוע החישובים וציור דיאגרמה חזותית, אנו מקבלים את הדברים הבאים.

כפי שניתן לראות, במדגם של 9 תצפיות, הערך של 50 נופל בתוך רווח הסמך (ההשערה לא נדחית), וב-25 תצפיות הוא לא נופל (ההשערה נדחית). יחד עם זאת, בניסוי עם 25 שקיות ניתן לטעון כי בהסתברות של 97.5% הממוצע הכללי עולה על 50.1 ק"ג (הגבול התחתון של רווח הסמך הוא 50.094 ק"ג). וזה מידע בעל ערך רב.

לפיכך, פתרנו את אותה בעיה בשלוש דרכים:

1. גישה עתיקה, השוואה בין הערך המחושב והטבלאי של קריטריון ה-t
2. מודרני יותר, על ידי חישוב רמת ה-p, הוספת מידה של ביטחון בדחיית ההשערה.
3. אפילו יותר אינפורמטיבי על ידי חישוב רווח הסמך וקבלת הערך המינימלי של הממוצע הכללי.

חשוב לזכור שמבחן t מתייחס לשיטות פרמטריות, כי מבוסס על התפלגות נורמלית (יש לו שני פרמטרים: ממוצע ושונות). לכן, ליישום המוצלח שלו, לפחות הנורמליות המשוערת של הנתונים הראשוניים והיעדר חריגים חשובים.

לבסוף, אני מציע לצפות בסרטון כיצד לבצע חישובים הקשורים למבחן t של סטודנט באקסל.

השיטה מאפשרת לבחון את ההשערה שהערכים הממוצעים של שתי האוכלוסיות הכלליות מהן השוו תלוידוגמאות שונות זו מזו. הנחת התלות פירושה לרוב שהתכונה נמדדת פעמיים באותו מדגם, למשל, לפני ואחרי החשיפה. במקרה הכללי, לכל נציג של מדגם אחד מוקצה נציג ממדגם אחר (הם משולבים בזוגות) כך ששתי סדרות הנתונים נמצאות בקורלציה חיובית זו עם זו. סוגים חלשים יותר של תלות של דגימות: מדגם 1 - בעלים, מדגם 2 - נשותיהם; מדגם 1 - ילדים בני שנה, מדגם 2 מורכב מתאומים של ילדים ממדגם 1 וכו'.

השערה סטטיסטית הניתנת לבדיקה,כמו במקרה הקודם, H 0: M 1 = M 2(ערכים ממוצעים בדגימות 1 ו-2 שווים). כאשר היא נדחתה, מתקבלת השערה חלופית לפיה M 1יותר פחות) M 2 .

הנחות ראשוניותלאימות סטטיסטי:

□ לכל נציג של מדגם אחד (מאוכלוסיה כללית אחת) נקבע נציג של מדגם אחר (מאוכלוסיה כללית אחרת);

□ הנתונים של שתי הדגימות מתואמים חיובי (זיווג);

□ התפלגות התכונה הנחקרת בשני המדגמים תואמת את החוק הרגיל.

מבנה נתונים ראשוני:ישנם שני ערכים של התכונה הנחקרת עבור כל אובייקט (עבור כל זוג).

הגבלות:התפלגות התכונה בשתי הדגימות לא צריכה להיות שונה משמעותית מזו הרגילה; הנתונים של שתי המדידות התואמות למדגם האחד והמדגם השני נמצאים בקורלציה חיובית.

חלופות:מבחן T-Wilcoxon, אם ההתפלגות עבור מדגם אחד לפחות שונה באופן משמעותי מהרגיל; מבחן t-student עבור מדגמים עצמאיים - אם הנתונים עבור שני מדגמים אינם מתואמים חיובי.

נוּסחָהשכן הערך האמפירי של מבחן ה-t של Student משקף את העובדה שיחידת ניתוח ההבדלים היא הבדל (תזוזה)ערכי תכונה עבור כל זוג תצפיות. בהתאם, עבור כל אחד מ-N זוגות של ערכי תכונה, ההפרש מחושב תחילה d i \u003d x 1 i - x 2 i.

(3) כאשר M d הוא הפרש הערכים הממוצע; σ d היא סטיית התקן של ההבדלים.

דוגמה לחישוב:

נניח שבמהלך בדיקת יעילות האימון, כל אחד מ-8 חברי הקבוצה נשאל את השאלה "באיזו תדירות הדעות שלך עולות בקנה אחד עם דעת הקבוצה?" - פעמיים, לפני ואחרי האימון. לתשובות, נעשה שימוש בסולם של 10 נקודות: 1 - לעולם לא, 5 - במחצית מהמקרים, 10 - תמיד. נבדקה ההשערה שכתוצאה מההכשרה תגבר ההערכה העצמית של קונפורמיות (הרצון להיות כמו אחרים בקבוצה) של המשתתפים (α = 0.05). בואו נעשה טבלה לחישובי ביניים (טבלה 3).

שולחן 3

הממוצע האריתמטי להפרש M d = (-6)/8= -0.75. הפחת ערך זה מכל d (העמודה הלפני אחרונה בטבלה).

הנוסחה לסטיית התקן שונה רק בכך ש-d מופיע במקום X. נחליף את כל הערכים הדרושים, נקבל

σd = 0.886.

שלב 1. חשב את הערך האמפירי של הקריטריון באמצעות נוסחה (3): ההפרש הממוצע מ ד= -0.75; סטיית תקן σ ד = 0,886; t ה = 2,39; df = 7.

שלב 2. אנו קובעים את רמת מובהקות ה-p מטבלת הערכים הקריטיים של מבחן ה-t של הסטודנט. עבור df = 7, הערך האמפירי הוא בין הקריטיים עבור p = 0.05 ו-p - 0.01. לכן, עמ'< 0,05.

df ר
0,05 0,01 0,001
2,365 3,499 5,408

שלב 3. אנו מקבלים החלטה סטטיסטית ומגבשים מסקנה. ההשערה הסטטיסטית שהאמצעים שווים נדחית. מסקנה: האינדיקטור של הערכה עצמית של התאמה של המשתתפים לאחר ההכשרה עלה באופן מובהק סטטיסטית (ברמת המובהקות עמ'< 0,05).

שיטות פרמטריות כוללות השוואה של השונות של שני מדגמים לפי הקריטריון F-Fischer.לפעמים שיטה זו מובילה למסקנות בעלות ערך רב, ובמקרה של השוואת אמצעים למדגמים בלתי תלויים, השוואת השונות היא חובהתהליך.

לחשב F empאתה צריך למצוא את היחס בין השונות של שתי הדגימות, וכך השונות הגדולה יותר נמצאת במונה, והמכנה הקטן יותר.

השוואה של שונות. השיטה מאפשרת לבחון את ההשערה שהשונות של שתי האוכלוסיות הכלליות מהן מופקות הדגימות המושוואות שונות זו מזו. השערה סטטיסטית שנבדקה H 0: σ 1 2 = σ 2 2 (השונות במדגם 1 שווה לשונות במדגם 2). כאשר היא נדחית, מקובלת השערה חלופית לפיה שונות אחת גדולה מהשנייה.

הנחות ראשוניות: שני מדגמים נמשכים באופן אקראי מאוכלוסיות כלליות שונות עם התפלגות נורמלית של התכונה הנחקרת.

מבנה נתונים ראשוני:התכונה הנחקרת נמדדת באובייקטים (נבדקים), שכל אחד מהם שייך לאחת משתי הדגימות המושוות.

הגבלות:ההתפלגות של התכונה בשתי הדגימות אינן שונות באופן משמעותי מזו הרגילה.

חלופה לשיטה:מבחן Levene "sTest, אשר יישומו אינו מצריך בדיקת הנחת התקינות (בשימוש בתוכנית SPSS).

נוּסחָהלערך האמפירי של מבחן F-Fisher:

(4)

איפה σ 1 2 - פיזור גדול, ו-σ 2 2 - פיזור קטן יותר. מכיוון שלא ידוע מראש איזו השונות גדולה יותר, אז כדי לקבוע את רמת ה-p, טבלת ערכים קריטיים עבור חלופות לא כיווניות.אם F ה > F Kpעבור המספר המקביל של דרגות החופש, אם כן ר < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

דוגמה לחישוב:

הילדים קיבלו את מטלות החשבון הרגילות, ולאחר מכן אחד שנבחר באקראי נאמר למחצית מהתלמידים שלא עברו את המבחן, והשאר - להיפך. אחר כך נשאל כל ילד כמה שניות ייקח לו לפתור בעיה דומה. הנסיין חישב את ההפרש בין הזמן שנקרא על ידי הילד לבין התוצאה של המשימה שהושלמה (בשניות). היה צפוי שדיווח על כישלון יגרום לחוסר התאמה מסוים בהערכה העצמית של הילד. ההשערה שנבדקה (ברמה של α = 0.005) הייתה שהשונות של אוכלוסיית ההערכות העצמיות אינה תלויה בדיווחים על הצלחה או כישלון (Н 0: σ 1 2=σ 2 2).

התקבלו הנתונים הבאים:


שלב 1. חשב את הערך האמפירי של הקריטריון ואת מספר דרגות החופש באמצעות נוסחאות (4):

שלב 2. לפי טבלת הערכים הקריטיים של קריטריון f-Fisher עבור לא כיווניתחלופות שאנו מוצאים להן את הערך הקריטי מספר df = 11; סימן df= 11. עם זאת, יש ערך קריטי רק עבור מספר df= 10 ו df סימן = 12. לא ניתן לקחת מספר גדול יותר של דרגות חופש, לכן אנו לוקחים את הערך הקריטי עבור מספר df= 10: עבור ר = 0,05 F Kp = 3.526; ל ר = 0,01 F Kp = 5,418.

שלב 3. קבלת החלטה סטטיסטית ומסקנה משמעותית. מאז הערך האמפירי עולה על הערך הקריטי עבור ר= 0.01 (ואפילו יותר עבור p = 0.05), אז במקרה זה עמ'< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (ר< 0.01). כתוצאה מכך, לאחר דיווח על כישלון, חוסר ההערכה העצמי גבוה יותר מאשר לאחר דיווח על הצלחה.

/ סטטיסטיקה מעשית / חומרי עזר / ערכי מבחן t תלמיד

מַשְׁמָעוּתט - מבחן תלמיד ברמת מובהקות של 0.10, 0.05 ו-0.01

ν – דרגות חופש וריאציה

ערכים סטנדרטיים של מבחן t של סטודנט

מספר דרגות החופש

רמות מובהקות

מספר דרגות החופש

רמות מובהקות

שולחן XI

ערכים סטנדרטיים של מבחן פישר המשמשים להערכת מובהקות ההבדלים בין שתי דגימות

דרגות חופש

רמת חשיבות

דרגות חופש

רמת חשיבות

מבחן t של תלמיד

מבחן t של תלמיד - שם נפוץלמחלקה של שיטות בדיקת השערות סטטיסטיות ( קריטריונים סטטיסטיים) מבוסס על התפלגות הסטודנטים. המקרים הנפוצים ביותר של יישום מבחן t קשורים לבדיקת שוויון האמצעים בשני מדגמים.

ט-סטטיסטיקה נבנית בדרך כלל על פי הדברים הבאים עיקרון כללי: במונה נמצא משתנה אקראי בעל תוחלת מתמטית אפס (כאשר השערת האפס מתגשמה), ובמכנה - סטיית התקן המדגם של משתנה מקרי זה, המתקבלת כ שורש ריבועימההערכה הבלתי מעורבת של השונות.

כַּתָבָה

קריטריון זה פותח על ידי ויליאם גוסט כדי להעריך את איכות הבירה בגינס. בהקשר להתחייבויות לחברה לאי גילוי סודות מסחריים (הנהגת גינס שקלה שימוש כזה במנגנון הסטטיסטי בעבודתם), מאמרו של גוסט פורסם ב-1908 בכתב העת Biometrics תחת השם הבדוי "סטודנט" (סטודנט) .

דרישות נתונים

כדי ליישם קריטריון זה, יש צורך שלנתונים המקוריים תהיה התפלגות נורמלית. במקרה של החלת מבחן דו-מדגם למדגמים בלתי תלויים, יש צורך לעמוד גם בתנאי של שוויון השונות. עם זאת, ישנן חלופות למבחן t של Student עבור מצבים עם שונות לא שוות.

הדרישה שהתפלגות הנתונים תהיה תקינה נחוצה למבחן t (\displaystyle t) המדויק. עם זאת, אפילו בהפצות נתונים אחרות, ניתן להשתמש ב-t (\displaystyle t) -סטטיסטיקה. במקרים רבים, לסטטיסטיקה זו יש באופן אסימפטוטי התפלגות נורמלית סטנדרטית - N (0 , 1) (\displaystyle N(0,1)), כך שניתן להשתמש בקוונטילים של התפלגות זו. עם זאת, לעתים קרובות אפילו במקרה זה, הקוונטילים משמשים לא מההתפלגות הנורמלית הסטנדרטית, אלא מההתפלגות המתאימה של Student, כמו במבחן t (\displaystyle t) המדויק. הם מקבילים מבחינה אסימפטוטית, אבל במדגמים קטנים, רווחי הסמך של התפלגות הסטודנט רחבים ואמינים יותר.

מבחן t מדגם אחד

הוא משמש לבדיקת השערת האפס H 0: E (X) = m (\displaystyle H_(0):E(X)=m) לגבי השוויון של התוחלת E (X) (\displaystyle E(X)) לחלקם ערך ידוע m (\displaystyle m) .

ברור שתחת השערת האפס E (X ¯) = m (\displaystyle E((\overline (X)))=m) . בהינתן העצמאות המשוערת של התצפיות, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . שימוש באומדן השונות הבלתי מוטה s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) נקבל את סטטיסטיקת ה-t הבאה:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\קו על (X))-m)(s_(X)/(\sqrt (n))))))

לפי השערת האפס, ההתפלגות של נתון זה היא t (n − 1) (\displaystyle t(n-1)) . לכן, אם הערך של סטטיסטיקה בערך מוחלט עולה על הערך הקריטי של התפלגות זו (ברמת מובהקות נתונה), השערת האפס נדחית.

מבחן t דו מדגם לדגימות עצמאיות

יהיו שני מדגמים בלתי תלויים של גדלים n 1, n 2 (\displaystyle n_(1)~,~n_(2)) של משתנים אקראיים בחלוקה נורמלית X 1, X 2 (\displaystyle X_(1),~X_(2 )) . יש צורך לבחון את השערת האפס של שוויון הציפיות המתמטיות של משתנים אקראיים אלה H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) תוך שימוש בנתונים לדוגמה.

קחו בחשבון את ההבדל של אמצעי המדגם Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . ברור שאם השערת האפס מתקיימת E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . השונות של הבדל זה היא, בהתבסס על עצמאות הדגימות: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) ^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . לאחר מכן השתמש באומדן השונות הבלתי מוטה s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n) ( X_(t)-(\קו על (X)))^(2))(n-1))) נקבל אומדן חסר פניות של השונות של ההבדל בין ממוצעי המדגם: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^ (2))(n_(2) ))) . לכן, סטטיסטיקת ה-t לבדיקת השערת האפס היא

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2)))))) ))

לנתון זה, לפי השערת האפס, יש התפלגות t (d f) (\displaystyle t(df)) , כאשר d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1 ) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)+ s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+( s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

אותו מקרה של שונות

אם ההנחה היא ששוני המדגם זהים, אז

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\right))

אז נתון ה-t הוא:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2)))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ (2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

לסטטיסטיקה זו יש התפלגות t (n 1 + n 2 - 2) (\displaystyle t(n_(1)+n_(2)-2))

מבחן t דו מדגם עבור דגימות תלויות

כדי לחשב את הערך האמפירי של t (\displaystyle t) -קריטריון במצב של בדיקת השערה לגבי ההבדלים בין שתי דגימות תלויות (לדוגמה, שתי דגימות של אותו מבחן עם מרווח זמן), נעשה שימוש בנוסחה הבאה :

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

כאשר M d (\displaystyle M_(d)) הוא ההבדל הממוצע של הערכים, s d (\displaystyle s_(d)) הוא סטיית התקן של ההבדלים, ו-n הוא מספר התצפיות

לנתון זה יש התפלגות של t (n - 1) (\displaystyle t(n-1)) .

בדיקת אילוץ ליניארי על פרמטרי רגרסיה ליניארית

באמצעות מבחן t, ניתן גם לבדוק אילוץ ליניארי שרירותי (יחיד) על הפרמטרים רגרסיה לינארית, מוערך בשיטה הרגילה הריבועים הקטנים ביותר. יהיה צורך לבדוק את ההשערה H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . ברור שתחת השערת האפס E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)=c^( T)E((\hat (b)))-a=0) . כאן אנו משתמשים בתכונה של אומדני הריבועים הקטנים חסרי הטיה של פרמטרי המודל E (b ^) = b (\displaystyle E((\hat (b)))=b) . בנוסף, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . שימוש במקום השונות הלא ידועה שלו באומדן הבלתי מוטה s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) נקבל את ה-t-סטטיסטיקה הבאה:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

לנתון זה, לפי השערת האפס, יש התפלגות של t (n - k) (\displaystyle t(n-k)), כך שאם הערך של הנתון גדול מהערך הקריטי, אז השערת האפס של אילוץ ליניארי היא נִדחֶה.

בדיקת השערות לגבי מקדם הרגרסיה הלינארית

מקרה מיוחד של אילוץ ליניארי הוא לבדוק את ההשערה שמקדם הרגרסיה b j (\displaystyle b_(j)) שווה לערך כלשהו a (\displaystyle a) . במקרה זה, סטטיסטיקת ה-t המקבילה היא:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

כאשר s b ^ j (\displaystyle s_((\hat (b))_(j))) היא השגיאה הסטנדרטית של אומדן המקדם - השורש הריבועי של האלמנט האלכסוני המתאים של מטריצת השונות של אומדני המקדם.

לפי השערת האפס, ההתפלגות של נתון זה היא t (n - k) (\displaystyle t(n-k)) . אם הערך המוחלט של הנתון גבוה מהערך הקריטי, אז ההפרש של המקדם מ-a (\displaystyle a) הוא מובהק סטטיסטית (לא אקראית), אחרת הוא לא מובהק (אקראי, כלומר, המקדם האמיתי הוא כנראה שווה או קרוב מאוד לערך הצפוי של (\ סגנון תצוגה a))

תגובה

ניתן לצמצם את המבחן של מדגם אחד לציפיות מתמטיות לבדיקת אילוץ ליניארי על פרמטרי הרגרסיה הליניארית. בבדיקה של מדגם אחד, מדובר ב"רגרסיה" על קבוע. לכן, s 2 (\displaystyle s^(2)) של הרגרסיה הוא אומדן מדגם של השונות של המשתנה האקראי הנחקר, המטריצה ​​X T X (\displaystyle X^(T)X) שווה ל-n (\displaystyle n) , והאומדן של "מקדם" המודל הוא ממוצע מדגם. מכאן אנו מקבלים את הביטוי לסטטיסטיקת ה-t שניתן לעיל למקרה הכללי.

באופן דומה, ניתן להראות כי מבחן של שני מדגמים עם שונות מדגם שוות מפחית גם לבדיקת אילוצים ליניאריים. במבחן דו מדגם, מדובר ב"רגרסיה" על קבוע ומשתני דמה המזהים תת מדגם בהתאם לערך (0 או 1): y = a + b D (\displaystyle y=a+bD) . ניתן לנסח את ההשערה לגבי שוויון הציפיות המתמטיות של הדגימות כהשערה לגבי השוויון של מקדם b של מודל זה לאפס. ניתן להראות שסטטיסטיקת ה-t המקבילה לבדיקת השערה זו שווה לסטטיסטיקת ה-t שניתנה עבור מבחן שני המדגמים.

ניתן גם לצמצם אותו לבדיקת האילוץ הליניארי במקרה של שונות שונות. במקרה זה, השונות של שגיאות המודל לוקחת שני ערכים. מכאן ניתן לקבל גם נתון t דומה לזה שניתן עבור מבחן שני המדגמים.

אנלוגים לא פרמטריים

אנלוגי למבחן שני המדגמים עבור דגימות עצמאיות הוא מבחן U-Man-Whitney. עבור המצב עם דגימות תלויות, האנלוגים הם מבחן הסימנים ומבחן ה- Wilcoxon T

סִפְרוּת

סטוּדֶנט.השגיאה הסבירה של ממוצע. // ביומטריקה. 1908. מס' 6 (1). עמ' 1-25.

קישורים

על הקריטריונים לבדיקת השערות לגבי הומוגניות של אמצעים באתר האינטרנט של האוניברסיטה הטכנית הממלכתית של נובוסיבירסק

מבחן t של תלמיד הוא שם כללי למחלקה של שיטות לבדיקה סטטיסטית של השערות (מבחנים סטטיסטיים) המבוססים על התפלגות התלמיד. המקרים הנפוצים ביותר של יישום מבחן t קשורים לבדיקת שוויון האמצעים בשני מדגמים.

1. היסטוריה של התפתחות מבחן ה-t

קריטריון זה פותח וויליאם גוסטלהעריך את איכות הבירה בגינס. בהקשר להתחייבויות כלפי החברה שלא לחשוף סודות מסחריים, פורסם מאמרו של גוסט ב-1908 בכתב העת Biometrics בשם הבדוי "סטודנט" (סטודנט).

2. לשם מה משמש מבחן ה-t של הסטודנט?

מבחן t של התלמיד משמש לקביעה מובהקות סטטיסטיתהבדלים בערכים הממוצעים. זה יכול לשמש גם במקרים של השוואת דגימות עצמאיות ( למשל, קבוצות של חולים סוכרתוקבוצות של בריאים), וכאשר משווים קבוצות קשורות ( למשל, קצב לב ממוצע באותם חולים לפני ואחרי נטילת תרופה נגד הפרעות קצב).

3. מתי ניתן להשתמש במבחן t של הסטודנט?

כדי ליישם את מבחן ה-t של הסטודנט, יש צורך בנתונים המקוריים התפלגות נורמלית. במקרה של יישום מבחן דו מדגם עבור דגימות עצמאיות, יש צורך גם לעמוד בתנאי שוויון (הומוסקדסטיות) של שונות.

אם תנאים אלה אינם מתקיימים, בעת השוואת ממוצעי מדגם, יש להשתמש בשיטות דומות. סטטיסטיקה לא פרמטרית, שביניהם המפורסמים ביותר מבחן U-Man-Whitney (כמבחן דו מדגם לדגימות בלתי תלויות), ו קריטריון סימןו בדיקת Wilcoxon(משמש במקרים של דגימות תלויות).

4. כיצד לחשב את מבחן ה-t של הסטודנט?

כדי להשוות את האמצעים, מבחן ה-t של הסטודנט מחושב באמצעות הנוסחה הבאה:

איפה M 1- ממוצע אריתמטי של האוכלוסייה (קבוצה) בהשוואה הראשונה, M 2- ממוצע אריתמטי של האוכלוסייה (קבוצה) בהשוואה השנייה, מ 1 - טעות מתכוונתממוצע אריתמטי ראשון, m2- השגיאה הממוצעת של הממוצע האריתמטי השני.

5. כיצד לפרש את הערך של מבחן ה-t של הסטודנט?

יש לפרש נכון את הערך המתקבל של מבחן t של הסטודנט. לשם כך, עלינו לדעת את מספר הנבדקים בכל קבוצה (n 1 ו-n 2). מציאת מספר דרגות החופש ולפי הנוסחה הבאה:

f \u003d (n 1 + n 2) - 2

לאחר מכן, אנו קובעים את הערך הקריטי של מבחן t של הסטודנט עבור רמת המובהקות הנדרשת (לדוגמה, p=0.05) ועבור מספר נתון של דרגות חופש ולפי הטבלה ( ראה למטה).

אנו משווים את הערכים הקריטיים והמחושבים של הקריטריון:

  • אם הערך המחושב של מבחן ה-t של הסטודנט שווה או גדול יותרקריטי, שנמצא בטבלה, אנו מסיקים שההבדלים בין הערכים המושוואים הם מובהקים סטטיסטית.
  • אם הערך של מבחן t המחושב של הסטודנט פָּחוּתטבלה, מה שאומר שההבדלים בין הערכים המושוואים אינם מובהקים סטטיסטית.

6. דוגמה לחישוב מבחן t של התלמיד

כדי לחקור את היעילות של תכשיר ברזל חדש, נבחרו שתי קבוצות של חולים עם אנמיה. בקבוצה הראשונה, חולים קיבלו תרופה חדשהוהקבוצה השנייה קיבלה פלצבו. לאחר מכן נמדדה רמת ההמוגלובין בדם היקפי. בקבוצה הראשונה, רמת ההמוגלובין הממוצעת הייתה 115.4±1.2 גרם/ליטר, ובשנייה - 103.7±2.3 גרם/ליטר (הנתונים מוצגים בפורמט M±m), לאוכלוסיות המושוואות יש התפלגות נורמלית. מספר הקבוצה הראשונה היה 34, והשנייה - 40 חולים. יש צורך להסיק מסקנה לגבי המובהקות הסטטיסטית של ההבדלים המתקבלים ויעילות תכשיר הברזל החדש.

פִּתָרוֹן:כדי להעריך את מובהקות ההבדלים, אנו משתמשים במבחן t של Student, המחושב כהפרש בין הממוצעים חלקי סכום השגיאות בריבוע:

לאחר ביצוע החישובים, ערך מבחן t היה שווה ל-4.51. אנו מוצאים את מספר דרגות החופש כמו (34 + 40) - 2 = 72. אנו משווים את הערך המתקבל של מבחן t של סטודנט 4.51 עם הערך הקריטי ב-p=0.05 המצוין בטבלה: 1.993. מכיוון שהערך המחושב של הקריטריון גדול מהערך הקריטי, אנו מסיקים שההבדלים הנצפים הם מובהקים סטטיסטית (רמת מובהקות p<0,05).

אחד הכלים הסטטיסטיים הידועים ביותר הוא מבחן ה-t של Student. הוא משמש למדידת המובהקות הסטטיסטית של כמויות שונות בזוגיות. ל- Microsoft Excel יש פונקציה מיוחדת לחישוב מחוון זה. בואו ללמוד כיצד לחשב את מבחן ה-t של סטודנט באקסל.

אבל, בתור התחלה, בואו עדיין נגלה מה הקריטריון של הסטודנט באופן כללי. מחוון זה משמש לבדיקת השוויון של הערכים הממוצעים של שתי דגימות. כלומר, הוא קובע את תקפות ההבדלים בין שתי קבוצות נתונים. במקביל, נעשה שימוש במערכת שלמה של שיטות לקביעת קריטריון זה. ניתן לחשב את המחוון עם התפלגות חד-זנב או דו-זנב.

חישוב המחוון באקסל

כעת נעבור לשאלה כיצד לחשב מחוון זה באקסל. ניתן לעשות זאת דרך הפונקציה מבחן סטודנטים. בגירסאות של Excel 2007 ואילך, זה נקרא TTEST. עם זאת, הוא הושאר בגרסאות מאוחרות יותר למטרות תאימות, אך עדיין מומלץ להשתמש בהן בגרסה מודרנית יותר - מבחן סטודנטים. ניתן להשתמש בפונקציה זו בשלוש דרכים, אשר יידונו בפירוט להלן.

שיטה 1: אשף הפונקציות

הדרך הקלה ביותר לחשב מחוון זה היא באמצעות אשף הפונקציות.


החישוב מתבצע, והתוצאה מוצגת על המסך בתא שנבחר מראש.

שיטה 2: עבודה עם הכרטיסייה נוסחאות

פוּנקצִיָה מבחן סטודנטיםניתן להתקשר גם על ידי מעבר לכרטיסייה "נוסחאות"באמצעות כפתור מיוחד על הסרט.


שיטה 3: כניסה ידנית

נוּסחָה מבחן סטודנטיםניתן גם להזין אותו באופן ידני לכל תא בגליון העבודה או בשורת הפונקציות. התחביר שלו נראה כך:

STUDENT.TEST(Array1,Array2,Tails,Type)

המשמעות של כל אחד מהטיעונים נלקחה בחשבון בעת ​​ניתוח השיטה הראשונה. יש להחליף ערכים אלה בפונקציה זו.

לאחר הזנת הנתונים, לחץ על הכפתור להיכנסכדי להציג את התוצאה על המסך.

כפי שניתן לראות, הקריטריון של הסטודנט מחושב באקסל בצורה פשוטה ומהירה. העיקר שהמשתמש שמבצע את החישובים צריך להבין מה הוא ואיזה נתוני קלט אחראים למה. התוכנית מבצעת את החישוב הישיר בעצמה.

פרסומים קשורים