בשנת 1971 פרסמו עמוס טברסקי ודניאל כהנמן מאמר פסיכולוגי שנקרא "אמונה בחוק המספרים הקטנים". שם הם טבעו לראשונה את המושג. מדובר בנטייה לתת משקל גבוה למדגמים קטנים. אנו נוטים לחשוב שתוצאה שהתקבלה במספר קטן של בדיקות היא תוצאה כללית, אף על פי שייתכן שהמדגם המצומצם אינו מייצג כלל. לפעמים ההכללה ממקרים בודדים לתוצאה כללית יותר נובעת מצורך פסיכולוגי לסכם ממצאים ולהבין את משמעותם בשפה פשוטה בעוד שבפועל לא תמיד יש אמצעים לבצע מדגם גדול. קוראים לכשל הזה הכללה חפוזה (hasty generalization). בפוסט הקודם הזכרתי את החבר שלי שהסיק מניסיונו האישי שניתן לקבוע את מין העובר מראש. כאמור, מדגם רחב שהתפרסם בכתב עת מדעי הראה שהשיטה הזו לא עובדת. כשל המהמר הוא דוגמה אחרת הקשורה לחוק המספרים הקטנים. אם זרקנו קובייה והמספר 5 הופיע שלוש פעמים ברצף, אנו נוטים לחשוב שההסתברות לקבל את המספר 5 גם בפעם הרביעית היא אפסית, בעוד שבפועל ההסתברות לא השתנתה והיא עדיין עומדת על שישית.
השם של "חוק המספרים הקטנים" אינו מקרי - מקורו בחוק המספרים הגדולים. חוק המספרים הגדולים אומר במילים פשוטות שמדגם גדול ייתן שגיאה קטנה באומדן של גדלים. כלומר, ככל שמגדילים את התצפית אנו מקטינים את השגיאה הסטטיסטית וההערכה שלנו מתקרבת לערך האמיתי. השם "חוק המספרים הקטנים" מרמז שבהתאם לאינטואיציה האנושית החוקיות של מדגמים קטנים דומה לחוקיות של מדגמים גדולים, בעוד שבפועל אין הדבר כך. לדוגמה, אם אזרוק קובייה אלף פעמים כל אחד מששת המספרים האפשריים יתקבל בערך בשישית מהמקרים, אבל אם אזרוק את הקובייה שש פעמים בלבד יש סיכוי לא רע שמספר אחד מתוך השישה יתקבל פעמיים או אפילו שלוש פעמים ואילו מספר אחר לא יתקבל כלל.
בסטטיסטיקה קיימים כלי ניתוח מדויקים שנועדו להעריך את טיב האומדן (estimation theory). על מנת לקבל את סדר הגודל של השגיאה אני בדרך כלל משתמש בהערכה ראשונית גסה לפיה השגיאה שווה לשורש ריבועי של גודל האומדן. מכאן נובע שהשגיאה היחסית (שגיאה חלקי גודל האומדן) יורדת כשהאומדן גדל. בהתאם לכך סקרים רחבים אמינים יותר מסקרים מצומצמים. אגב, בסקרים פוליטיים שמתפרסמים בעיתונים יש בעיה נוספת: השאלה לא תמיד ברורה ולא תמיד רלוונטית. קשה להעריך את מידת ההטיה שנובעת מכך, ולכן אני בדרך כלל לא מתייחס לתוצאות שלהם. בשפה סטטיסטית אומרים שבסקרים כאלו יש גם שגיאה שיטתית ולא רק שגיאה סטטיסטית. קיימת לעתים גם הצגה שקרית של תוצאות סקרים, אבל זו כבר בעיה אחרת.
באותו הקשר, בשנת 1980 הגה חובב החידות המתמטיות מרטין גרדנר את "החוק החזק של המספרים הקטנים": אין מספיק מספרים קטנים על מנת למלא את כל הדרישות שבהן עליהם לעמוד. זהו שם הומוריסטי לתופעה שבה נתקלים חובבי חידות מתמטיות. נראה לעתים שסדרה של מספרים קטנים ממלאת חוקיות מסוימת, אבל אם ממשיכים הלאה החוקיות נשברת בסופו של דבר. למשל, ארבעת המספרים האי-זוגיים הראשונים הם המספר 1 או מספר ראשוני (1,3,5,7). אם ממשיכים את הסדרה רואים שכלל זה אינו נכון משום ש-9 אינו ראשוני. קיימות דוגמאות משעשעות נוספות ל"חוק" הזה.
השם של "חוק המספרים הקטנים" אינו מקרי - מקורו בחוק המספרים הגדולים. חוק המספרים הגדולים אומר במילים פשוטות שמדגם גדול ייתן שגיאה קטנה באומדן של גדלים. כלומר, ככל שמגדילים את התצפית אנו מקטינים את השגיאה הסטטיסטית וההערכה שלנו מתקרבת לערך האמיתי. השם "חוק המספרים הקטנים" מרמז שבהתאם לאינטואיציה האנושית החוקיות של מדגמים קטנים דומה לחוקיות של מדגמים גדולים, בעוד שבפועל אין הדבר כך. לדוגמה, אם אזרוק קובייה אלף פעמים כל אחד מששת המספרים האפשריים יתקבל בערך בשישית מהמקרים, אבל אם אזרוק את הקובייה שש פעמים בלבד יש סיכוי לא רע שמספר אחד מתוך השישה יתקבל פעמיים או אפילו שלוש פעמים ואילו מספר אחר לא יתקבל כלל.
בסטטיסטיקה קיימים כלי ניתוח מדויקים שנועדו להעריך את טיב האומדן (estimation theory). על מנת לקבל את סדר הגודל של השגיאה אני בדרך כלל משתמש בהערכה ראשונית גסה לפיה השגיאה שווה לשורש ריבועי של גודל האומדן. מכאן נובע שהשגיאה היחסית (שגיאה חלקי גודל האומדן) יורדת כשהאומדן גדל. בהתאם לכך סקרים רחבים אמינים יותר מסקרים מצומצמים. אגב, בסקרים פוליטיים שמתפרסמים בעיתונים יש בעיה נוספת: השאלה לא תמיד ברורה ולא תמיד רלוונטית. קשה להעריך את מידת ההטיה שנובעת מכך, ולכן אני בדרך כלל לא מתייחס לתוצאות שלהם. בשפה סטטיסטית אומרים שבסקרים כאלו יש גם שגיאה שיטתית ולא רק שגיאה סטטיסטית. קיימת לעתים גם הצגה שקרית של תוצאות סקרים, אבל זו כבר בעיה אחרת.
באותו הקשר, בשנת 1980 הגה חובב החידות המתמטיות מרטין גרדנר את "החוק החזק של המספרים הקטנים": אין מספיק מספרים קטנים על מנת למלא את כל הדרישות שבהן עליהם לעמוד. זהו שם הומוריסטי לתופעה שבה נתקלים חובבי חידות מתמטיות. נראה לעתים שסדרה של מספרים קטנים ממלאת חוקיות מסוימת, אבל אם ממשיכים הלאה החוקיות נשברת בסופו של דבר. למשל, ארבעת המספרים האי-זוגיים הראשונים הם המספר 1 או מספר ראשוני (1,3,5,7). אם ממשיכים את הסדרה רואים שכלל זה אינו נכון משום ש-9 אינו ראשוני. קיימות דוגמאות משעשעות נוספות ל"חוק" הזה.
5 תגובות:
אפרופו קוביה, קראתי פעם (איפה?) את הטענה הזו - כל הדיונים הסטטיסטיים אודות קוביות מניחות קוביה מאוזנת. בחיים "הממשיים", אם קוביה נותנת ארבע פעמים רצופות את התוצאה 5, לא רק שלא נכונה האינטואיציה שיש סיכוי נמוך לקבלת 5 בהטלה הבאה, אלא שיתכן שהסיכוי גבוה משישית. הסיכוי הנמוך לקבלת רצף 4 פעמים 5, שהתממש, מעלה את האפשרות שהקוביה לא מאוזנת. לכן מה יהיה הניחוש ההגיוני להימור אחרי 4 פעמים 5?
ניחשתם נכון. שוב 5.
נקודה נוספת (מהניסיון שלי בשש-בש): פעמים רבות אנו זורקים את הקובייה חלש והיא לא קופצת או שאנו לא נותנים לה מספיק מהירות סיבובית והיא לא מסתובבת, ובמקרה כזה, גם אם הקובייה מאוזנת, היא עלולה ליפול על אותו צד מספר פעמים בזה אחר זה.
בכל אופן, גם לגבי שתי ההשערות הללו (שלי ושל יוחאי) שתומכות בהסתברות גבוהה יותר לקבל את אותו מספר, כדאי לזרוק את הקובייה לפחות עוד כמה פעמים על מנת לקבל סטטיסטיקה גדולה יותר ולהיזהר מחוק המספרים הקטנים...
תודה רבה על המאמר - עזר לי מאוד.
אבל במחקרים סטיטיסטיים נגיד סוציולוגיה החוק של המספרים הגדולים מעיד על בעיה אינהרנטית בגלל שככל שהסקר יותר גדול כך תהיה הסתברות גבוהה להוכחת ההנחה של החוקר ומכאן להוכחה לא תקפה שלה שנובעת מהתופעה המדעית של מיצוע בסקרים גדולים (אני לא בטוח בזה אבל נראה לי שזה כך).
לסיון - ככל שהמדגם גדול יותר כך השגיאה קטנה יותר. זה אומר שיש יותר ודאות לגבי התוצאה בין אם היא תומכת בהשערה של החוקר ובין אם לאו.
הוסף רשומת תגובה