רווח סמך לציפיות מתמטיות. מרווחי סמך

אומדן רווחי סמך

מטרות למידה

הסטטיסטיקה מתייחסת לדברים הבאים שתי משימות עיקריות:

    יש לנו איזושהי אומדן המבוסס על נתונים מדגמיים ואנו רוצים לעשות איזו הצהרה הסתברותית לגבי היכן נמצא הערך האמיתי של הפרמטר המוערך.

    יש לנו השערה ספציפית שצריך לבדוק בהתבסס על נתונים לדוגמה.

בנושא זה נשקול את הבעיה הראשונה. אנו מציגים גם את ההגדרה של רווח סמך.

רווח סמך הוא מרווח שבנוי סביב הערך המשוער של פרמטר ומראה היכן נמצא הערך האמיתי של הפרמטר המוערך בהסתברות נתונה אפריורית.

לאחר לימוד החומר בנושא זה, אתה:

    למד מהו רווח הסמך של האומדן;

    ללמוד לסווג בעיות סטטיסטיות;

    לשלוט בטכניקה של בניית רווחי סמך, הן באמצעות נוסחאות סטטיסטיות והן באמצעות כלי תוכנה;

    למד לקבוע את גדלי המדגם הנדרשים כדי להשיג פרמטרים מסוימים של דיוק של אומדנים סטטיסטיים.

התפלגות מאפייני המדגם

הפצת T

כפי שנדון לעיל, ההתפלגות של המשתנה המקרי קרובה להתפלגות נורמלית סטנדרטית עם פרמטרים 0 ו-1. מכיוון שאיננו יודעים את הערך של σ, אנו מחליפים אותו באומדן כלשהו s . לכמות כבר יש חלוקה שונה, כלומר, או חלוקת הסטודנטים, אשר נקבע על ידי הפרמטר n -1 (מספר דרגות החופש). התפלגות זו קרובה להתפלגות הנורמלית (ככל ש-n גדול יותר, ההתפלגויות קרובות יותר).

על איור. 95
מוצגת התפלגות התלמיד עם 30 דרגות חופש. כפי שאתה יכול לראות, זה קרוב מאוד להתפלגות הנורמלית.

בדומה לפונקציות לעבודה עם ההתפלגות הנורמלית NORMDIST ו- NORMINV, ישנן פונקציות לעבודה עם התפלגות t - STUDIST (TDIST) ו STUDRASPBR (TINV). דוגמה לשימוש בפונקציות אלו ניתן למצוא בקובץ STUDRIST.XLS (תבנית ופתרון) ובאיור. 96
.

התפלגות של מאפיינים אחרים

כפי שאנו כבר יודעים, כדי לקבוע את הדיוק של אומדן הציפיות, אנו צריכים התפלגות t. כדי להעריך פרמטרים אחרים, כגון שונות, נדרשות התפלגויות אחרות. שניים מהם הם התפלגות F ו x 2 -הפצה.

רווח סמך לממוצע

מרווח ביטחוןהוא מרווח הבנוי סביב הערך המשוער של הפרמטר ומראה היכן נמצא הערך האמיתי של הפרמטר המוערך בהסתברות נתונה אפריורית.

מתרחשת בניית רווח סמך עבור הערך הממוצע בדרך הבאה:

דוגמא

מסעדת המזון המהיר מתכננת להרחיב את המבחר שלה עם סוג חדש של כריך. על מנת להעריך את הביקוש אליו, המנהל מתכנן לבחור באקראי 40 מבקרים מבין אלו שכבר התנסו ולבקש מהם לדרג את יחסם למוצר החדש בסולם מ-1 עד 10. המנהל רוצה להעריך את מספר הנקודות הצפוי שהמוצר החדש יקבל ובניית רווח סמך של 95% לאומדן זה. איך לעשות את זה? (ראה קובץ SANDWICH1.XLS (תבנית ופתרון).

פִּתָרוֹן

כדי לפתור בעיה זו, אתה יכול להשתמש . התוצאות מוצגות באיור. 97
.

רווח סמך עבור הערך הכולל

לפעמים, על פי נתונים לדוגמה, נדרש לאמוד לא את התוחלת המתמטית, אלא את סך הערכים. לדוגמה, במצב עם רואה חשבון מבקר, יכול להיות עניין להעריך לא את הערך הממוצע של חשבונית, אלא את סכום כל החשבוניות.

תן N להיות המספר הכולל של אלמנטים, n יהיה גודל המדגם, T 3 יהיה סכום הערכים במדגם, T" יהיה אומדן הסכום על כל האוכלוסייה, ואז , ורווח הסמך מחושב על ידי הנוסחה , כאשר s הוא אומדן סטיית התקן עבור המדגם, הוא אומדן הממוצע עבור המדגם.

דוגמא

נניח שמשרד מס רוצה להעריך את סכום החזרי המס הכוללים עבור 10,000 נישומים. הנישום מקבל החזר או משלם מסים נוספים. מצא את מרווח הסמך של 95% עבור סכום ההחזר, בהנחה שגודל מדגם של 500 אנשים (ראה קובץ החזר סכום.XLS (תבנית ופתרון).

פִּתָרוֹן

אין הליך מיוחד ב-StatPro למקרה זה, עם זאת, ניתן לראות שניתן לקבל את הגבול מהגבולות של הממוצע באמצעות הנוסחאות לעיל (איור 98
).

רווח סמך לפרופורציה

תן p להיות התוחלת של נתח לקוחות, ו- pv להיות אומדן של נתח זה, המתקבל ממדגם בגודל n. ניתן להראות כי עבור גדול מספיק התפלגות האומדן תהיה קרובה לנורמה עם p ממוצע וסטיית תקן . טעות התקן של האומדן במקרה זה מתבטאת כ , ורווח הסמך כ .

דוגמא

מסעדת המזון המהיר מתכננת להרחיב את המבחר שלה עם סוג חדש של כריך. על מנת להעריך את הביקוש אליו, בחר המנהל באקראי 40 מבקרים מבין אלו שכבר התנסו וביקש מהם לדרג את יחסם למוצר החדש בסולם מ-1 עד 10. המנהל רוצה להעריך את הפרופורציה הצפויה. של לקוחות שמדרגים את המוצר החדש לפחות מ-6 נקודות (הוא מצפה שלקוחות אלו יהיו הצרכנים של המוצר החדש).

פִּתָרוֹן

בתחילה, אנו יוצרים עמודה חדשה על בסיס 1 אם הציון של הלקוח היה יותר מ-6 נקודות ו-0 אחרת (ראה קובץ SANDWICH2.XLS (תבנית ופתרון).

שיטה 1

סופרים את הכמות של 1, אנו מעריכים את המניה, ולאחר מכן אנו משתמשים בנוסחאות.

הערך של z cr נלקח מטבלאות התפלגות נורמלית מיוחדות (לדוגמה, 1.96 עבור רווח סמך של 95%.

באמצעות גישה זו ונתונים ספציפיים לבניית מרווח של 95%, אנו משיגים את התוצאות הבאות (איור 99
). הערך הקריטי של הפרמטר z cr הוא 1.96. טעות התקן של האומדן היא 0.077. הגבול התחתון של רווח הסמך הוא 0.475. הגבול העליון של רווח הסמך הוא 0.775. כך, מנהל יכול להניח בוודאות של 95% שאחוז הלקוחות שידרגו מוצר חדש ב-6 נקודות ומעלה יהיה בין 47.5 ל-77.5.

שיטה 2

ניתן לפתור בעיה זו באמצעות כלים סטנדרטיים של StatPro. לשם כך, די לציין כי המניה במקרה זה עולה בקנה אחד עם הערך הממוצע של העמודה Type. הבא להגיש בקשה StatPro/Inference Statistical/One-Sample Analysisכדי לבנות רווח סמך עבור הערך הממוצע (אומדן ציפיות) עבור העמודה סוג. התוצאות המתקבלות במקרה זה יהיו קרובות מאוד לתוצאה של השיטה הראשונה (איור 99).

רווח סמך לסטיית תקן

s משמש כאומדן של סטיית התקן (הנוסחה ניתנת בסעיף 1). פונקציית הצפיפות של האומדן s היא פונקציית ה-chi בריבוע, שבדומה להתפלגות t, יש n-1 דרגות חופש. ישנן פונקציות מיוחדות לעבודה עם הפצה זו CHI2DIST (CHIDIST) ו-CHI2OBR (CHIINV) .

רווח הסמך במקרה זה לא יהיה עוד סימטרי. הסכימה המותנית של הגבולות מוצגת באיור. 100 .

דוגמא

על המכונה לייצר חלקים בקוטר של 10 ס"מ. עם זאת, עקב נסיבות שונות, מתרחשות שגיאות. בקר האיכות מודאג משני דברים: ראשית, הערך הממוצע צריך להיות 10 ס"מ; שנית, גם במקרה זה, אם הסטיות גדולות, אז פרטים רבים יידחו. כל יום הוא מכין דגימה של 50 חלקים (ראה קובץ QUALITY CONTROL.XLS (תבנית ופתרון) אילו מסקנות מדגם כזה יכול לתת?

פִּתָרוֹן

אנו בונים רווחי סמך של 95% עבור הממוצע ועבור סטיית התקן באמצעות StatPro/Inference Statistical/One-Sample Analysis(איור 101
).

יתר על כן, תוך שימוש בהנחה של התפלגות נורמלית של קטרים, אנו מחשבים את שיעור המוצרים הפגומים, תוך הגדרת סטייה מקסימלית של 0.065. באמצעות היכולות של טבלת החיפוש (במקרה של שני פרמטרים), אנו בונים את התלות של אחוז הדחיות בערך הממוצע ובסטיית התקן (איור 102
).

רווח סמך להפרש של שני אמצעים

זהו אחד היישומים החשובים ביותר של שיטות סטטיסטיות. דוגמאות למצב.

    מנהל חנות בגדים רוצה לדעת כמה פחות או יותר מוציאה הקונה הממוצעת בחנות מאשר גבר.

    שתי חברות התעופה טסות בנתיבים דומים. ארגון צרכנים מעוניין להשוות את ההבדל בין זמני העיכוב הממוצעים הצפויים בטיסות לשתי חברות התעופה.

    החברה שולחת קופונים לסוגי סחורה מסוימים בעיר אחת ואינה שולחת בעיר אחרת. מנהלים רוצים להשוות את ממוצע הרכישות של פריטים אלו במהלך החודשיים הקרובים.

    סוחר רכב מרבה להתעסק עם זוגות נשואים במצגות. כדי להבין את התגובות האישיות שלהם למצגת, זוגות מתראיינים לרוב בנפרד. המנהל רוצה להעריך את ההבדל בדירוגים שניתנו על ידי גברים ונשים.

מקרה של דגימות עצמאיות

להבדל הממוצע תהיה התפלגות t עם n 1 + n 2 - 2 דרגות חופש. רווח הסמך עבור μ 1 - μ 2 מבוטא ביחס:

ניתן לפתור בעיה זו לא רק על ידי הנוסחאות לעיל, אלא גם על ידי כלים סטנדרטיים של StatPro. כדי לעשות זאת, זה מספיק כדי ליישם

רווח סמך להפרש בין פרופורציות

תן להיות הציפייה המתמטית של המניות. נהיה הערכות המדגם שלהם שנבנו על מדגמים בגודל n 1 ו-n 2, בהתאמה. אז יש אומדן להפרש. לכן, רווח הסמך להפרש זה מתבטא כך:

כאן z cr הוא הערך המתקבל מהתפלגות נורמלית של טבלאות מיוחדות (לדוגמה, 1.96 עבור רווח בר סמך של 95%.

טעות התקן של האומדן מתבטאת במקרה זה על ידי היחס:

.

דוגמא

החנות, לקראת המכירה הגדולה, ביצעה את המחקר השיווקי הבא. 300 הקונים המובילים נבחרו וחולקו באופן אקראי לשתי קבוצות של 150 חברים כל אחת. לכל הרוכשים שנבחרו נשלחו הזמנות להשתתף במבצע, אך רק לחברי הקבוצה הראשונה צורף קופון המעניק זכות ל-5% הנחה. במהלך המכירה נרשמו הרכישות של כל 300 הקונים הנבחרים. כיצד מנהל יכול לפרש את התוצאות ולעשות שיקול דעת לגבי יעילות הקופון? (ראה קובץ COUPONS.XLS (תבנית ופתרון)).

פִּתָרוֹן

במקרה הספציפי שלנו, מתוך 150 לקוחות שקיבלו קופון הנחה, 55 ביצעו רכישה במבצע, ובין 150 שלא קיבלו קופון, רק 35 ביצעו רכישה (איור 103
). אז הערכים של פרופורציות המדגם הם 0.3667 ו-0.2333, בהתאמה. והפרש המדגם ביניהם שווה ל-0.1333, בהתאמה. בהנחה של רווח סמך של 95%, אנו מוצאים מטבלת ההתפלגות הנורמלית z cr = 1.96. חישוב שגיאת התקן של הפרש המדגם הוא 0.0524. לבסוף, אנו מקבלים שהגבול התחתון של רווח הסמך של 95% הוא 0.0307, ​​והגבול העליון הוא 0.2359, בהתאמה. ניתן לפרש את התוצאות המתקבלות כך שעל כל 100 לקוחות שקיבלו קופון הנחה, נוכל לצפות ל-3 עד 23 לקוחות חדשים. עם זאת, יש לזכור כי מסקנה זו כשלעצמה אין פירושה יעילות השימוש בקופונים (כי במתן הנחה אנחנו מפסידים ברווח!). בואו נדגים זאת על נתונים ספציפיים. נניח שסכום הרכישה הממוצע הוא 400 רובל, מתוכם 50 רובל. יש רווח בחנות. אז הרווח הצפוי לכל 100 לקוחות שלא קיבלו קופון שווה ל:

50 0.2333 100 \u003d 1166.50 רובל.

חישובים דומים עבור 100 קונים שקיבלו קופון נותנים:

30 0.3667 100 \u003d 1100.10 רובל.

הירידה ברווח הממוצע ל-30 מוסברת על ידי העובדה שבאמצעות ההנחה, קונים שקיבלו קופון יבצעו בממוצע רכישה תמורת 380 רובל.

לפיכך, המסקנה הסופית מצביעה על חוסר היעילות של שימוש בקופונים כאלה במצב מסוים זה.

תגובה. ניתן לפתור בעיה זו באמצעות כלים סטנדרטיים של StatPro. לשם כך, די לצמצם בעיה זו לבעיה של הערכת הפרש של שני ממוצעים לפי השיטה, ולאחר מכן ליישם StatPro/Inference Statistical/Two-Sample Analysisלבנות רווח סמך להפרש בין שני ערכים ממוצעים.

בקרת רווחי סמך

אורך רווח הסמך תלוי ב התנאים הבאים:

    נתונים ישירים (סטיית תקן);

    רמת חשיבות;

    גודל המדגם.

גודל מדגם להערכת הממוצע

הבה נבחן תחילה את הבעיה במקרה הכללי. הבה נסמן את הערך של מחצית מאורך רווח הסמך שניתן לנו כ-B (איור 104
). אנו יודעים שרווח הסמך עבור הערך הממוצע של איזה משתנה אקראי X מבוטא כ , איפה . בהנחה:

ומבטא נ , נקבל .

למרבה הצער, איננו יודעים את הערך המדויק של השונות של המשתנה האקראי X. בנוסף, איננו יודעים את הערך של t cr מכיוון שהוא תלוי ב-n דרך מספר דרגות החופש. במצב זה, נוכל לעשות את הפעולות הבאות. במקום השונות, אנו משתמשים באומדן כלשהו של השונות עבור כמה מימושים זמינים של המשתנה האקראי הנחקר. במקום ערך t cr, אנו משתמשים בערך z cr עבור ההתפלגות הנורמלית. זה די מקובל, שכן פונקציות הצפיפות עבור ההתפלגות הנורמלית וה-t קרובות מאוד (למעט המקרה של n קטן). לפיכך, הנוסחה הרצויה לובשת את הצורה:

.

מכיוון שהנוסחה נותנת, באופן כללי, תוצאות שאינן שלמות, עיגול עם עודף מהתוצאה נלקח כגודל המדגם הרצוי.

דוגמא

מסעדת המזון המהיר מתכננת להרחיב את המבחר שלה עם סוג חדש של כריך. על מנת להעריך את הביקוש אליו, המנהל מתכנן באופן אקראי לבחור מספר מבקרים מבין אלו שכבר התנסו, ולבקש מהם לדרג את יחסם למוצר החדש בסולם מ-1 עד 10. המנהל רוצה להעריך את מספר הנקודות הצפוי שהמוצר החדש יקבל מוצר ותאר את רווח הסמך של 95% של הערכה זו. עם זאת, הוא רוצה שחצי מרוחב רווח הסמך לא יעלה על 0.3. כמה מבקרים הוא צריך לסקר?

כדלהלן:

כאן רוטסהוא אומדן של השבר p, ו-B הוא חצי נתון מאורך רווח הסמך. ניתן לקבל ערך מנופח עבור n באמצעות הערך רוטס= 0.5. במקרה זה, אורך רווח הסמך לא יעלה על הערך הנתון B עבור כל ערך אמיתי של p.

דוגמא

תנו למנהל מהדוגמה הקודמת לתכנן להעריך את שיעור הלקוחות שמעדיפים סוג חדש של מוצר. הוא רוצה לבנות רווח בר-סמך של 90% שחצי אורכו קטן או שווה ל-0.05. כמה לקוחות יש לדגום באופן אקראי?

פִּתָרוֹן

במקרה שלנו, הערך של z cr = 1.645. לכן, הכמות הנדרשת מחושבת כ .

אם למנהל הייתה סיבה להאמין שהערך הרצוי של p הוא, למשל, בערך 0.3, אז על ידי החלפת ערך זה בנוסחה לעיל, נקבל ערך קטן יותר של המדגם האקראי, כלומר 228.

נוסחה לקבוע גדלי מדגם אקראי במקרה של הבדל בין שני אמצעיםכתוב כ:

.

דוגמא

לחברת מחשבים כלשהי יש מרכז שירות לקוחות. לאחרונה, גדל מספר התלונות של לקוחות על איכות השירות הירודה. במרכז השירות מועסקים בעיקר שני סוגי עובדים: בעלי ניסיון מועט, אך שעברו השתלמויות מיוחדות, ובעלי ניסיון מעשי רב, אך לא סיימו קורסים מיוחדים. החברה רוצה לנתח תלונות של לקוחות במהלך ששת החודשים האחרונים ולהשוות את מספרם הממוצע לכל אחת משתי קבוצות העובדים. ההנחה היא שהמספרים בדגימות עבור שתי הקבוצות יהיו זהים. כמה עובדים חייבים להיכלל במדגם כדי לקבל מרווח של 95% עם חצי אורך של לא יותר מ-2?

פִּתָרוֹן

כאן σ ots הוא אומדן של סטיית התקן של שני המשתנים האקראיים בהנחה שהם קרובים. לפיכך, במשימה שלנו, אנחנו צריכים איכשהו להשיג את האומדן הזה. ניתן לעשות זאת, למשל, באופן הבא. בהסתכלות על נתוני תלונות לקוחות במהלך ששת החודשים האחרונים, מנהל עשוי להבחין שבדרך כלל יש בין 6 ל-36 תלונות לכל עובד. ביודעו כי עבור התפלגות נורמלית כמעט כל הערכים אינם יותר משלוש סטיות תקן מהממוצע, הוא יכול להאמין באופן סביר כי:

, ומכאן σ ots = 5.

החלפת ערך זה בנוסחה, נקבל .

נוסחה לקבוע גודל מדגם אקראי במקרה של הערכת ההפרש בין המניותנראה כמו:

דוגמא

לחברה כלשהי יש שני מפעלים לייצור מוצרים דומים. מנהל חברה רוצה להשוות את שיעורי הליקויים בשני המפעלים. לפי מידע זמין, שיעור הדחייה בשני המפעלים הוא בין 3 ל-5%. זה אמור לבנות רווח סמך של 99% עם חצי אורך של לא יותר מ-0.005 (או 0.5%). כמה מוצרים יש לבחור מכל מפעל?

פִּתָרוֹן

כאן p 1ot ו-p 2ot הם אומדנים של שני חלקים לא ידועים של דחיות במפעלים 1 ו-2. אם נשים p 1ots \u003d p 2ots \u003d 0.5, אז נקבל ערך מוערך יתר על המידה עבור n. אבל מכיוון שבמקרה שלנו יש לנו מידע אפריורי על מניות אלה, אנו לוקחים את האומדן העליון של מניות אלה, כלומר 0.05. אנחנו מקבלים

כאשר מספר פרמטרים של אוכלוסיה נאמדים מנתוני מדגם, כדאי לספק לא רק אומדן נקודתי של הפרמטר, אלא גם רווח סמך המראה היכן עשוי להיות הערך המדויק של הפרמטר המוערך.

בפרק זה הכרנו גם קשרים כמותיים המאפשרים לבנות מרווחים כאלה לפרמטרים שונים; למדו דרכים לשלוט באורך רווח הסמך.

אנו מציינים גם שניתן לפתור את בעיית הערכת גודל המדגם (בעיית תכנון ניסוי) באמצעות כלים סטנדרטיים של StatPro, כלומר StatPro/מסק סטטיסטי/בחירת גודל מדגם.

מאמר זה מתאר את תחביר הנוסחה והשימוש בפונקציה אמוןב-Microsoft Excel.

תיאור

מחזירה את רווח הסמך לממוצע האוכלוסייה עם התפלגות נורמלית.

רווח סמך הוא טווח של ערכים. ממוצע המדגם x הוא האמצע של טווח זה, ומכאן שרווח הסמך מוגדר כ-x ± CONFIDENCE. לדוגמה, אם x הוא ממוצע המדגם של זמן האספקה ​​עבור פריטי הזמנה בדואר, אזי תוחלת האוכלוסייה היא במרווח x ± CONFIDENCE. עבור כל ערך של התוחלת המתמטית של האוכלוסייה הכללית μ0, שנמצאת במרווח זה, ההסתברות שממוצע המדגם נבדל מ-μ0 ביותר מ-x עולה על רמת המובהקות "אלפא". עבור כל תוחלת מתמטית μ0 שאינה קשורה למרווח זה, ההסתברות שממוצע המדגם שונה מ-μ0 ביותר מ-x אינה חורגת מרמת המובהקות "אלפא". נניח, למשל, שבהינתן ממוצע המדגם x, סטיית התקן של האוכלוסייה וגודל המדגם, אתה רוצה ליצור מבחן מדגם כפול ברמת מובהקות של אלפא כדי לבדוק את ההשערה שהממוצע הוא μ0. במקרה זה, ההשערה לא נדחית אם μ0 שייך לרווח הסמך, ונדחת אם μ0 לא. רווח הסמך אינו מאפשר לנו להניח כי בהסתברות (1 - אלפא) זמן האספקה ​​של החבילה הבאה יהיה בתוך רווח הסמך.

חָשׁוּב:פונקציה זו הוחלפה בפונקציה חדשה אחת או יותר המספקות דיוק רב יותר ובעלות שמות המשקפים טוב יותר את מטרתן. למרות שתכונה זו עדיין משמשת לתאימות לאחור, ייתכן שהיא לא תהיה זמינה בגירסאות עתידיות של Excel, לכן אנו ממליצים להשתמש בתכונות החדשות.

למידע נוסף על התכונות החדשות, ראה פונקציית CONFIDENCE NORM ופונקציית CONFIDENCE STUDENT.

תחביר

TRUST(alpha, standard_dev, size)

לפונקציה TRUST יש את הארגומנטים הבאים:

    אלפאהוא טיעון נדרש. רמת המובהקות המשמשת לחישוב רמת הביטחון. רמת הביטחון היא 100*(1 - אלפא) אחוז, או במילים אחרות, ערך אלפא של 0.05 פירושו 95 אחוז ביטחון.

    Standard_offהוא טיעון נדרש. ההנחה היא שסטיית התקן של האוכלוסייה עבור טווח הנתונים ידועה.

    הגודלהוא טיעון נדרש. גודל המדגם.

הערות

דוגמא

העתק את הנתונים לדוגמה מהטבלה הבאה והדבק אותם בתא A1 של גיליון Excel חדש. כדי להציג תוצאות נוסחאות, בחר אותן והקש F2 ולאחר מכן על ENTER. שנה את רוחב העמודות, במידת הצורך, כדי לראות את כל הנתונים.

מרווחי ביטחון עבור תדרים וחלקים

© 2008

המכון הלאומי לבריאות הציבור, אוסלו, נורבגיה

המאמר מתאר ודן בחישוב רווחי סמך לתדרים ופרופורציות בשיטות Wald, Wilson, Klopper-Pearson, תוך שימוש בטרנספורמציה הזוויתית ובשיטת Wald עם תיקון Agresti-Cowll. החומר המוצג מספק מידע כללי על שיטות לחישוב רווחי סמך לתדרים ופרופורציות ונועד לעורר את עניין קוראי כתב העת לא רק בשימוש במרווחי סמך בעת הצגת תוצאות המחקר שלהם, אלא גם בקריאת ספרות מיוחדת לפני תחילת העבודה. עבודה על פרסומים עתידיים.

מילות מפתח: רווח סמך, תדירות, פרופורציה

באחד הפרסומים הקודמים צוין בקצרה תיאור הנתונים האיכותניים ודווח כי אומדן המרווחים שלהם עדיפה על אומדן נקודתי לתיאור תדירות התרחשות המאפיין הנחקר באוכלוסייה הכללית. ואכן, מאחר שמחקרים נערכים באמצעות נתוני מדגם, הקרנת התוצאות על האוכלוסייה הכללית חייבת להכיל אלמנט של אי דיוק באומדן המדגם. רווח הסמך הוא מדד לדיוק של הפרמטר המשוער. מעניין שבחלק מהספרים על יסודות הסטטיסטיקה לרופאים, מתעלמים לחלוטין מהנושא של רווחי סמך לתדרים. במאמר זה נשקול מספר דרכים לחישוב רווחי סמך עבור תדרים, בהנחה של מאפייני מדגם כגון אי-חזרה וייצוגיות, וכן את עצמאות התצפיות זו מזו. התדירות במאמר זה אינה מובנת כמספר מוחלט המראה כמה פעמים ערך זה או אחר מתרחש במצטבר, אלא כערך יחסי הקובע את שיעור המשתתפים במחקר בעלי התכונה הנחקרת.

במחקר ביו-רפואי, רווחי סמך של 95% משמשים לרוב. רווח סמך זה הוא האזור שבתוכו היחס האמיתי נופל ב-95% מהזמן. במילים אחרות, ניתן לומר בוודאות של 95% שהערך האמיתי של תדירות התרחשות של תכונה באוכלוסייה הכללית יהיה בטווח הסמך של 95%.

רוב ספרי הלימוד הסטטיסטיים לחוקרים רפואיים מדווחים כי טעות התדירות מחושבת באמצעות הנוסחה

כאשר p הוא תדירות המופע של התכונה במדגם (ערך מ-0 עד 1). ברוב המאמרים המדעיים המקומיים, מצוין הערך של תדירות ההופעה של תכונה במדגם (p), כמו גם השגיאה שלה בצורה של p ± s. עם זאת, כדאי יותר להציג רווח סמך של 95% לתדירות הופעת תכונה באוכלוסייה הכללית, שיכלול ערכים מ

לפני.

בספרי לימוד מסוימים, עבור מדגמים קטנים, מומלץ להחליף את הערך של 1.96 בערך של t עבור N - 1 דרגות חופש, כאשר N הוא מספר התצפיות במדגם. הערך של t נמצא בטבלאות של התפלגות t, הזמינות כמעט בכל ספרי הלימוד בסטטיסטיקה. השימוש בהפצה של t עבור שיטת Wald אינו מספק יתרונות גלויים על פני שיטות אחרות הנדונות להלן, ולכן אינו מתקבל בברכה על ידי חלק מהכותבים.

השיטה הנ"ל לחישוב רווחי סמך לתדרים או לשברים נקראת על שמו של אברהם ולד (אברהם ולד, 1902–1950), מאחר שהחל להיות בשימוש נרחב לאחר פרסום ולד ווולפוביץ ב-1939. עם זאת, השיטה עצמה הוצעה על ידי פייר סימון לפלס (1749–1827) כבר ב-1812.

שיטת Wald פופולרית מאוד, אך היישום שלה כרוך בבעיות משמעותיות. השיטה אינה מומלצת לגדלים קטנים של מדגם, כמו גם במקרים בהם תדירות התרחשות של תכונה נוטה ל-0 או 1 (0% או 100%) ופשוט אינה אפשרית עבור תדרים של 0 ו-1. בנוסף, קירוב ההתפלגות הנורמלית, המשמש בעת חישוב השגיאה, "לא עובד" במקרים שבהם n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

מכיוון שהמשתנה החדש מתפלג נורמלית, הגבול התחתון והעליון של רווח הסמך של 95% עבור המשתנה φ יהיו φ-1.96 ו-φ+1.96left">

במקום 1.96 עבור דגימות קטנות, מומלץ להחליף את הערך של t עבור N - 1 דרגות חופש. שיטה זו אינה נותנת ערכים שליליים ומאפשרת להעריך בצורה מדויקת יותר את רווחי הסמך לתדרים מאשר שיטת Wald. בנוסף, הוא מתואר בספרי עיון מקומיים רבים על סטטיסטיקה רפואית, אשר, עם זאת, לא הוביל לשימוש נרחב במחקר רפואי. חישוב רווחי סמך באמצעות טרנספורמציה של זווית אינו מומלץ עבור תדרים המתקרבים ל-0 או 1.

כאן מסתיים בדרך כלל תיאור השיטות להערכת רווחי סמך ברוב הספרים על יסודות הסטטיסטיקה עבור חוקרים רפואיים, ובעיה זו אופיינית לא רק לספרות מקומית, אלא גם לספרות זרה. שתי השיטות מבוססות על משפט הגבול המרכזי, המרמז על מדגם גדול.

בהתחשב בחסרונות של הערכת רווחי סמך באמצעות השיטות הנ"ל, קלופר (קלופר) ופירסון (פירסון) הציעו בשנת 1934 שיטה לחישוב מה שנקרא רווח סמך מדויק, תוך התחשבות בהתפלגות הבינומית של התכונה הנחקרת. שיטה זו זמינה במחשבונים מקוונים רבים, אולם רווחי הסמך המתקבלים בדרך זו הם ברוב המקרים רחבים מדי. יחד עם זאת, שיטה זו מומלצת לשימוש במקרים בהם נדרשת אומדן זהיר. מידת השמרנות של השיטה עולה ככל שגודל המדגם פוחת, במיוחד עבור N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

לדברי סטטיסטיקאים רבים, ההערכה האופטימלית ביותר של רווחי סמך לתדרים מתבצעת בשיטת ווילסון, שהוצעה עוד בשנת 1927, אך למעשה לא נעשה בה שימוש במחקר ביו-רפואי ביתי. שיטה זו מאפשרת לא רק להעריך רווחי סמך לתדרים קטנים מאוד וגם לתדרים גבוהים מאוד, אלא גם ישימה למספר קטן של תצפיות. באופן כללי, לרווח הסמך לפי נוסחת ווילסון יש את הצורה מ



כאשר הוא לוקח את הערך 1.96 בעת חישוב רווח הסמך של 95%, N הוא מספר התצפיות, ו-p הוא התדירות של התכונה במדגם. שיטה זו זמינה במחשבונים מקוונים, כך שהיישום שלה אינו בעייתי. ולא ממליץ להשתמש בשיטה זו עבור n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

בנוסף לשיטת וילסון, מאמינים ששיטת Wald מתוקנת Agresti-Caull מספקת הערכה מיטבית של רווח הסמך לתדרים. תיקון Agresti-Coulle הוא תחליף בנוסחת Wald לתדירות הופעת תכונה במדגם (p) ב-p`, כאשר מחשבים איזה 2 מתווספים למונה, ו-4 מתווספים למכנה, כלומר , p` = (X + 2) / (N + 4), כאשר X הוא מספר המשתתפים במחקר שיש להם את התכונה הנחקרת, ו-N הוא גודל המדגם. שינוי זה מייצר תוצאות דומות מאוד לאלו של נוסחת ווילסון, למעט כאשר שיעור האירועים מתקרב ל-0% או 100% והמדגם קטן. בנוסף לשיטות הנ"ל לחישוב רווחי סמך לתדרים, הוצעו תיקוני המשכיות הן לשיטת Wald והן לשיטת וילסון עבור דגימות קטנות, אך מחקרים הראו שהשימוש בהם אינו הולם.

שקול את היישום של השיטות לעיל לחישוב רווחי סמך באמצעות שתי דוגמאות. במקרה הראשון, אנו חוקרים מדגם גדול של 1,000 משתתפי מחקר שנבחרו אקראית, מתוכם 450 בעלי התכונה הנחקרת (בין אם זה גורם סיכון, תוצאה או כל תכונה אחרת), שהיא שכיחות של 0.45, או 45%. במקרה השני, המחקר מתבצע באמצעות מדגם קטן, למשל, רק 20 אנשים, ורק למשתתף אחד במחקר (5%) יש את התכונה הנחקרת. רווחי סמך עבור שיטת Wald, עבור שיטת Wald עם תיקון Agresti-Coll, עבור שיטת Wilson חושבו באמצעות מחשבון מקוון שפותח על ידי Jeff Sauro (http://www./wald.htm). רווחי סמך של Wilson מתוקנו ברציפות חושבו באמצעות המחשבון שסופק על ידי Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). חישובים באמצעות טרנספורמציה זוויתית של פישר בוצעו "ידנית" תוך שימוש בערך הקריטי של t עבור 19 ו-999 דרגות חופש, בהתאמה. תוצאות החישוב מוצגות בטבלה עבור שתי הדוגמאות.

רווחי סמך מחושבים בשש דרכים שונות עבור שתי הדוגמאות המתוארות בטקסט

שיטת חישוב רווחי סמך

P=0.0500, או 5%

95% CI עבור X=450, N=1000, P=0.4500 או 45%

–0,0455–0,2541

ולדה עם תיקון אגרסטי-קול

<,0001–0,2541

ווילסון עם תיקון המשכיות

"השיטה המדויקת" של קלופר-פירסון

טרנספורמציה זוויתית

<0,0001–0,1967

כפי שניתן לראות מהטבלה, עבור הדוגמה הראשונה, רווח הסמך המחושב בשיטת Wald "המקובלת" נכנס לאזור השלילי, מה שלא יכול להיות המקרה עבור תדרים. למרבה הצער, אירועים כאלה אינם נדירים בספרות הרוסית. הדרך המסורתית לייצוג נתונים כתדר והשגיאה שלו מחפה חלקית על בעיה זו. לדוגמה, אם תדירות ההופעה של תכונה (באחוזים) מוצגת כ-2.1 ± 1.4, אז זה לא "מעצבן" כמו 2.1% (95% CI: -0.7; 4.9), אם כי ופירושו אותו הדבר. שיטת Wald עם תיקון Agresti-Coulle והחישוב באמצעות הטרנספורמציה הזוויתית נותנים גבול תחתון השואף לאפס. שיטת ווילסון עם תיקון המשכיות ו"השיטה המדויקת" נותנות רווחי סמך רחבים יותר משיטת ווילסון. בדוגמה השנייה, כל השיטות נותנות בערך את אותם רווחי סמך (ההבדלים מופיעים רק באלפיות), וזה לא מפתיע, שכן תדירות האירוע בדוגמה זו אינה שונה בהרבה מ-50%, וגודל המדגם די גדול .

לקוראים המתעניינים בבעיה זו, אנו יכולים להמליץ ​​על העבודות של R. G. Newcombe ובראון, Cai ו- Dasgupta, הנותנות את היתרונות והחסרונות של שימוש ב-7 ו-10 שיטות שונות לחישוב רווחי סמך, בהתאמה. מתוך מדריכים ביתיים, הספר ומומלץ, שבו, בנוסף לתיאור מפורט של התיאוריה, מוצגות שיטות Wald ו-Wilson, וכן שיטה לחישוב רווחי סמך, תוך התחשבות בהתפלגות התדר הבינומי. בנוסף למחשבונים מקוונים בחינם (http://www./wald.htm ו-http://faculty.vassar.edu/lowry/prop1.html), ניתן לחשב רווחי סמך לתדרים (ולא רק!) באמצעות תוכנית CIA ( ניתוח מרווחי סמך ), אותה ניתן להוריד מ- http://www. בית ספר לרפואה. סוטון. ac. uk/cia/ .

המאמר הבא יסתכל על דרכים חד-משתניות להשוואת נתונים איכותיים.

בִּיבּלִיוֹגְרָפִיָה

בנרג'י א.סטטיסטיקה רפואית בשפה פשוטה: קורס מבוא / א' בנרז'י. - מ' : רפואה מעשית, 2007. - 287 עמ'. סטטיסטיקה רפואית / . - מ' : סוכנות מידע רפואית, 2007. - 475 עמ'. גלנץ ש.סטטיסטיקה רפואית-ביולוגית / ש' גלנטס. - מ': תרגול, 1998. סוגי נתונים, אימות הפצה וסטטיסטיקה תיאורית / // אקולוגיה אנושית - 2008. - מס' 1. - עמ' 52–58. ז'יז'ין ק.ס.. סטטיסטיקה רפואית: ספר לימוד / . - Rostov n / D: Phoenix, 2007. - 160 p. סטטיסטיקה רפואית יישומית / , . - סנט פטרסבורג. : Folio, 2003. - 428 עמ'. לאקין ג.פ. ביומטריה / . - מ. : בית ספר גבוה, 1990. - 350 עמ'. חובש V.A. סטטיסטיקה מתמטית ברפואה / , . - מ' : מימון וסטטיסטיקה, 2007. - 798 עמ'. סטטיסטיקה מתמטית במחקר קליני / , . - מ. : GEOTAR-MED, 2001. - 256 עמ'. יונקרוב V. ו. עיבוד רפואי-סטטיסטי של נתוני מחקר רפואי /,. - סנט פטרסבורג. : VmedA, 2002. - 266 עמ'. אגרסטי א.משוער עדיף על מדויק להערכת מרווחים של פרופורציות בינומיות / A. Agresti, B. Coull // סטטיסטיקאי אמריקאי. - 1998. - נ 52. - ש' 119-126. אלטמן ד.סטטיסטיקה בביטחון // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - לונדון: BMJ Books, 2000. - 240 עמ'. בראון ל.ד.הערכת מרווחים עבור פרופורציה בינומית / L. D. Brown, T. T. Cai, A. Dasgupta // מדע סטטיסטי. - 2001. - נ 2. - עמ' 101-133. קלופר סי ג'יי.השימוש בביטחון או בגבולות נאמנות מודגם במקרה של הבינומי / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - נ 26. - עמ' 404-413. גרסיה-פרס מ.א. על רווח הסמך לפרמטר הבינומי / M. A. Garcia-Perez // איכות וכמות. - 2005. - נ 39. - עמ' 467-481. מוטולסקי ה.ביוסטטיסטיקה אינטואיטיבית // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 עמ'. Newcombe R.G.רווחי סמך דו-צדדיים לשיעור הבודד: השוואה של שבע שיטות / R. G. Newcombe // סטטיסטיקה ברפואה. - 1998. - נ' 17. - עמ' 857–872. סאורו ג'יי.הערכת שיעורי השלמה ממדגמים קטנים באמצעות רווחי סמך בינומיים: השוואות והמלצות / J. Sauro, J. R. Lewis // המפגש השנתי של האגודה לגורמים אנושיים וארגונומיה. - אורלנדו, פלורידה, 2005. ולד א.גבולות ביטחון עבור פונקציות התפלגות רציפות // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - נ 10. - עמ' 105–118. ווילסון אי.ב. מסקנות סבירות, חוק הירושה והסקה סטטיסטית / E. B. Wilson // Journal of American Statistical Association. - 1927. - נ 22. - עמ' 209-212.

מרווחי ביטחון עבור פרופורציות

א. מ' גריבובסקי

המכון הלאומי לבריאות הציבור, אוסלו, נורבגיה

המאמר מציג מספר שיטות לחישוב רווחי סמך עבור פרופורציות בינומיות, כלומר שיטות Wald, Wilson, arcsine, Agresti-Coull ושיטות קלופר-פירסון המדויקות. המאמר נותן רק מבוא כללי לבעיית הערכת רווחי סמך ביחס בינומיים ומטרתו היא לא רק לעורר את הקוראים להשתמש ברווחי סמך בעת הצגת תוצאות של מרווחי מחקר אמפיריים משלהם, אלא גם לעודד אותם לעיין בספרי סטטיסטיקה לפני כן. לניתוח נתונים משלו והכנת כתבי יד.

מילות מפתח: רווח סמך, פרופורציה

פרטי התקשרות:

יועץ בכיר, המכון הלאומי לבריאות הציבור, אוסלו, נורבגיה

כל מדגם נותן רק מושג משוער של האוכלוסייה הכללית, וכל המאפיינים הסטטיסטיים של המדגם (ממוצע, מצב, שונות...) הם קירוב או נניח אומדן של הפרמטרים הכלליים, שברוב המקרים לא ניתן לחישוב בשל חוסר הנגישות של האוכלוסייה הכללית (איור 20).

איור 20. שגיאת דגימה

אבל אתה יכול לציין את המרווח שבו, במידה מסוימת של הסתברות, נמצא הערך האמיתי (הכללי) של המאפיין הסטטיסטי. מרווח זה נקרא ד רווח סמך (CI).

אז הממוצע הכללי עם הסתברות של 95% נמצא בפנים

מ-עד, (20)

איפה ט - ערך טבלאי של קריטריון הסטודנט עבור α =0.05 ו ו= נ-1

ניתן למצוא ו-99% CI, במקרה זה ט נבחר עבור α =0,01.

מהי המשמעות המעשית של רווח סמך?

    רווח סמך רחב מצביע על כך שממוצע המדגם אינו משקף במדויק את ממוצע האוכלוסייה. זה נובע בדרך כלל מגודל מדגם לא מספיק, או מההטרוגניות שלו, כלומר. פיזור גדול. שניהם נותנים שגיאה גדולה בממוצע ובהתאם, CI רחב יותר. וזו הסיבה לחזור לשלב תכנון המחקר.

    גבולות CI עליונים ותחתונים מעריכים אם התוצאות יהיו משמעותיות מבחינה קלינית

הבה נתעכב ביתר פירוט על שאלת המשמעות הסטטיסטית והקלינית של תוצאות חקר מאפייני הקבוצה. נזכיר כי משימת הסטטיסטיקה היא לזהות לפחות כמה הבדלים באוכלוסיות כלליות, בהתבסס על נתוני מדגם. משימתו של הקלינאי היא למצוא הבדלים כאלה (לא כלשהם) שיסייעו לאבחון או לטיפול. ולא תמיד מסקנות סטטיסטיות הן הבסיס למסקנות קליניות. לפיכך, ירידה מובהקת סטטיסטית בהמוגלובין ב-3 גרם/ליטר אינה סיבה לדאגה. ולהפך, אם לבעיה כלשהי בגוף האדם אין אופי המוני ברמה של כלל האוכלוסייה, זו לא סיבה לא להתמודד עם הבעיה הזו.

נשקול עמדה זו ב דוגמא.

החוקרים תהו אם נערים שחלו במחלה זיהומית כלשהי נמצאים בפיגור אחר בני גילם בצמיחה. לצורך כך נערך מחקר סלקטיבי, בו השתתפו 10 נערים שחלו במחלה זו. התוצאות מוצגות בטבלה 23.

טבלה 23. תוצאות סטטיסטיות

גבול תחתון

גבול עליון

מפרטים (ס"מ)

אֶמצַע

מחישובים אלו עולה כי הגובה הממוצע הסלקטיבי של נערים בני 10 שחלו במחלה זיהומית כלשהי קרוב לנורמה (132.5 ס"מ). עם זאת, הגבול התחתון של רווח הסמך (126.6 ס"מ) מצביע על כך שקיימת סבירות של 95% שהגובה הממוצע האמיתי של ילדים אלו מתאים למושג "קומה נמוכה", כלומר. הילדים האלה נבוכים.

בדוגמה זו, התוצאות של חישובי רווחי הסמך מובהקות מבחינה קלינית.

המוח נמצא לא רק בידע, אלא גם ביכולת ליישם ידע בפועל. (אריסטו)

מרווחי סמך

ביקורת כללית

בנטילת מדגם מהאוכלוסייה, נקבל אומדן נקודתי של הפרמטר המעניין אותנו ונחשב את טעות התקן על מנת להצביע על דיוק האומדן.

עם זאת, ברוב המקרים, שגיאת התקן ככזו אינה מקובלת. הרבה יותר שימושי לשלב מדד זה של דיוק עם אומדן מרווחים עבור פרמטר האוכלוסייה.

ניתן לעשות זאת על ידי שימוש בידע של התפלגות ההסתברות התיאורטית של סטטיסטיקת המדגם (פרמטר) על מנת לחשב רווח סמך (CI - רווח סמך, CI - רווח סמך) עבור הפרמטר.

באופן כללי, רווח הסמך מרחיב את האומדנים בשני הכיוונים בכפולה כלשהי של שגיאת התקן (של פרמטר נתון); שני הערכים (מגבלות סמך) שמגדירים את המרווח מופרדים בדרך כלל בפסיק ומסוגרים בסוגריים.

רווח סמך לממוצע

באמצעות ההתפלגות הנורמלית

לממוצע המדגם יש התפלגות נורמלית אם גודל המדגם גדול, כך שניתן ליישם ידע על ההתפלגות הנורמלית כאשר בוחנים את ממוצע המדגם.

בפרט, 95% מהתפלגות ממוצעי המדגם נמצאת בטווח של 1.96 סטיות תקן (SD) מממוצע האוכלוסייה.

כאשר יש לנו רק מדגם אחד, אנו קוראים לזה שגיאת התקן של הממוצע (SEM) ומחשבים את רווח הסמך של 95% עבור הממוצע באופן הבא:

אם הניסוי הזה יחזור על עצמו מספר פעמים, אז המרווח יכיל את ממוצע האוכלוסיה האמיתי 95% מהזמן.

זה בדרך כלל רווח סמך, כמו טווח הערכים שבתוכו נמצא ממוצע האוכלוסייה האמיתי (ממוצע כללי) עם רמת ביטחון של 95%.

למרות שזה לא ממש קפדני (ממוצע האוכלוסייה הוא ערך קבוע ולכן לא יכול להיות קשור אליו) לפרש את רווח הסמך בצורה זו, קל יותר להבין אותו מבחינה רעיונית.

נוֹהָג t-הפצה

אתה יכול להשתמש בהתפלגות הנורמלית אם אתה יודע את ערך השונות באוכלוסייה. כמו כן, כאשר גודל המדגם קטן, ממוצע המדגם עוקב אחר התפלגות נורמלית אם הנתונים שבבסיס האוכלוסייה מחולקים בצורה נורמלית.

אם הנתונים שבבסיס האוכלוסייה אינם מחולקים בצורה נורמלית ו/או השונות הכללית (שונות האוכלוסייה) אינה ידועה, ממוצע המדגם מציית התפלגות t של תלמיד.

חשב את רווח הסמך של 95% עבור ממוצע האוכלוסייה באופן הבא:

איפה - נקודת אחוז (אחוזון) t-התפלגות תלמידים עם (n-1) דרגות חופש, הנותנת הסתברות דו-זנבתית של 0.05.

באופן כללי, הוא מספק מרווח רחב יותר מאשר בעת שימוש בהתפלגות נורמלית, מכיוון שהוא לוקח בחשבון את אי הוודאות הנוספת שנוצרת על ידי הערכת סטיית התקן של האוכלוסייה ו/או בשל גודל המדגם הקטן.

כאשר גודל המדגם גדול (מסדר גודל של 100 או יותר), ההבדל בין שתי ההתפלגויות ( t-סטודנטונורמלי) הוא זניח. עם זאת, השתמש תמיד t-התפלגות בעת חישוב רווחי סמך, גם אם גודל המדגם גדול.

בדרך כלל ניתן 95% CI. ניתן לחשב רווחי סמך אחרים, כגון 99% CI עבור הממוצע.

במקום מכפלה של שגיאת תקן וערך טבלה t-התפלגות התואמת להסתברות דו-זנבתית של 0.05 תכפיל אותה (שגיאת תקן) בערך המתאים להסתברות דו-זנבתית של 0.01. זהו רווח סמך רחב יותר מהמקרה של 95% מכיוון שהוא משקף ביטחון מוגבר שהמרווח אכן כולל את ממוצע האוכלוסייה.

רווח סמך לפרופורציה

להתפלגות הדגימה של פרופורציות יש התפלגות בינומית. עם זאת, אם גודל המדגם נגדול למדי, אז התפלגות מדגם הפרופורציה היא נורמלית בקירוב עם ממוצע .

אומדן לפי יחס דגימה p=r/n(איפה ר- מספר הפרטים במדגם עם המאפיינים המעניינים אותנו), וטעות התקן נאמדת:

רווח הסמך של 95% לשיעור מוערך:

אם גודל המדגם קטן (בדרך כלל מתי npאוֹ n(1-p)פָּחוּת 5 ), אז יש להשתמש בהתפלגות הבינומית על מנת לחשב את רווחי הסמך המדויקים.

שימו לב שאם עמבוטא באחוזים, אם כן (1-p)הוחלף על ידי (100p).

פרשנות של רווחי סמך

כאשר מפרשים את רווח הסמך, אנו מתעניינים בשאלות הבאות:

כמה רחב רווח הסמך?

רווח סמך רחב מצביע על כך שההערכה אינה מדויקת; צר מציין הערכה נאה.

רוחב רווח הסמך תלוי בגודל השגיאה הסטנדרטית, אשר, בתורה, תלוי בגודל המדגם, וכאשר בוחנים משתנה מספרי מהשונות של הנתונים, נותן רווחי סמך רחבים יותר מאשר מחקרים על מערך נתונים גדול. של מעט משתנים.

האם ה-CI כולל ערכים בעלי עניין מיוחד?

אתה יכול לבדוק אם הערך הסביר של פרמטר אוכלוסייה נופל בתוך רווח סמך. אם כן, אז התוצאות תואמות את הערך הסביר הזה. אם לא, אז לא סביר (עבור רווח בר סמך של 95%, הסיכוי הוא כמעט 5%) שלפרמטר יש את הערך הזה.

פרסומים קשורים

  • מהי התמונה r של ברונכיטיס מהי התמונה r של ברונכיטיס

    הוא תהליך דלקתי פרוגרסיבי מפוזר בסימפונות, המוביל למבנה מחדש מורפולוגי של דופן הסימפונות ו...

  • תיאור קצר של זיהום ב-HIV תיאור קצר של זיהום ב-HIV

    תסמונת הכשל החיסוני האנושי - איידס, זיהום בנגיף הכשל החיסוני האנושי - זיהום ב-HIV; כשל חיסוני נרכש...