מלחמת בחירות?
מאת נביא שקר
דגש על סימן השאלה בכותרת.
הנקודה העיקרית, למי שלא רוצה לקרוא הרבה
אין מספיק נתונים בשביל להגיד האם בחירות בישראל מעלות את הסיכוי למלחמה. זה לא אומר שבחירות לא משפיעות על קבלת החלטות.
רקע
הרבה אנשים העלו את השאלה הברורה – האם עיתוי הסיבוב הנוכחי בין ישראל לעזה הושפע מכך שיש בחירות בקרוב? התשובות חלוקות, בין ברור שכן לאולי לא. נחום ברנע טען בסוף השבוע האחרון שברור שמלחמה מועילה לאופוזיציה, ועל-כן לא סביר שנתניהו יצא למתקפה מתוך מחשבה על בחירות, אלא למרות הבחירות. יש אינספור פרשנים אחרים שטוענים באותה מידה של בטחון שפיצוצי רקטות מאירים את הממשלה באור מרשים בעוד האופוזיציה נשארת בחושך, ולכן המתקפה עכשיו.
בין כל המלל בולט לטובה הפוסט הזה במדריך הטרמפיסט לסטטיסטיקה, שמנסה להזריק קצת נתונים לדיון המתנהל רובו בתווך בין תחושת בטן לצעקה גרונית. הפוסט מציג את מערכות הבחירות האחרונות בישראל, מבצעים של צה'ל, טילים פלסטינים והרוגים פלסטיניים, ואת המחאה החברתית. הוא נמנע מלענות באופן ברור על השאלה 'האם בחירות בישראל מגבירות את הסיכוי למבצע צבאי', אבל מעלה כמה נקודות למחשבה.
עם כל ההערכה לגרף ולניתוח, יש שם לא מעט בעיות. את רוב הבעיות מעלה הכותב בעצמו, והדברים הבאים אינם בגדר ביקורת, אלא פשוט נקודת הסתכלות אחרת. הבעיות העיקריות שלי היו:
1. התקופה שנבדקה מאוד מצומצמת.
2. הרוגים פלסטיניים ורקטות זה עניין רלוונטי, אבל הוא לא היחיד. יש אירועים אחרים כמו מתקפה בלבנון, או תקיפת הכור בסוריה, שאינם מושפעים או משפיעים הרבה על הרוגים פלסטיניים ורקטות, אבל לו נערכו סמוך לבחירות ברור שהיה עולה חשד להטייה.
3. המודל שבודק את תגובות הצדדים מאוד פשוט (כאמור, זאת בעיה שהכותב עצמו מכיר בה). חוקרים באמ-איי-טי ניסו למדל את כל עניין הרקטות-אל-מול-הרוגים-אל-מול-תקיפות באמצעות מודלים קצת יותר מורכבים הבונים 'פונקציות תגובה' לשני הצדדים, והגיעו לסקנה ששני הצדדים מגיבים בצורה רציונאלית וסיבתית משהו (*** הערה מתקנת: טל גלילי מצביע על כך שנכתב מאמר תגובה למאמר הזה על ידי עמיתים בתל-אביב, שטוען שנפלה שם טעות. היו תגובות לכך אך לדברי גלילי הן לא היו מספיקות. כדאי באופן כללי לקרוא את ההערות של גלילי על הפוסט).
הצעה
במקום להסתכל רק על הרוגים פלסטיניים, רקטות, ומבצעים כנגד הרצועה, הבה נבדוק את מבצעי צה'ל המשמעותיים מאז שנות ה-90. עבור כל מבצע שכזה, נבדוק היכן הוא נופל בתקופה שבין 2 מערכות בחירות. נחלק כל תקופה כזאת שרירותית ל-12 'תאים' ונשים 1+ בכל תא בו התרחשה מתקפה שכזו.
לאחר מכן נסתכל על ההיסטוגרמה שנוצרה ונבדוק האם יש סטייה מהתפלגות יוניפורמית ("הבחירות לא משפיעות") לכיוון התפלגות ששמה משקל רב יותר על התאים האחרונים ("בחירות מתקרבות גוררות הסלמה"). אפשר לעשות השוואת פקטורים בייסיאנית, אבל בואו קודם נסתכל על הנתונים.
הנתון העיקרי והבעייתי כאן הוא תקיפות צה'ל. שלפתי את התקיפות מהאינטרנט, אבל הרבה מהן לא רלוונטיות (מבצעים קטנים במהלך האינתיפאדה השנייה, למשל). נאלצתי להפעיל שיקול דעת סובייקטיבי משהו. שאלתי 'אם מבצע כזה היה נערך סמוך לבחירות, האם אנשים היו טוענים שיש כאן אפשרות לקורלציה'.
כאמור, גישה מאוד לא מושלמת. אני מביא בסוף את המבצעים שכללתי. אם לאנשים יש נימוקים מדוע להוריד או להוסיף מבצעים – בבקשה. חסרים גם אירועים כמו פתיחת מנהרת הכותל והתנקשויות שונות. מצד שני חסרים גם אירועים לא אלימים שקשורים לבחירות כמו ניסיונות משא ומתן והטבות שונות.
תוצאה
מסקנות
המסקנה האישית שלי היא –
אין באמת מספיק נתונים בשביל לדחות או לקבל את ההשערה שבחירות מעלות את הסיכוי לתקיפה. אפשר לבנות מודל חלופי ליוניפורמי, לעשות ניתוח ולהגיע למספר כלשהו, אבל זה יהיה די שברירי. ומה הטעם? 'מבחן הטראומה האינטרא-אוקולרית' (או יותר נכון העדר טראומה שכזו) רומז שאיננו יכולים לדחות את ההשערה שישראל תוקפת בערך אותה מידה בכל נקודת זמן. אם נכנס נתונים ל-3 תאים בלבד, ההסתברות יוצאת בערך שליש-שליש-שליש.
כדאי להדגיש – אני לא אומר שסיבוב הלחימה הנוכחי בהכרח לא הושפע מהבחירות, או שסיבובי לחימה ותקיפות קודמות סמוך לבחירות לא לקחו את הבחירות בחשבון. הערה פשוטה שתתגלה בפרוטוקולים של חברי הקבינט שווה הרבה יותר מכל הגרפים האלה.
כדאי להדגיש 2 – הניתוח הזה מאוד פשטני. הוא לא לוקח בחשבון בצורה מספקת את העובדה שלא תמיד יודעים מתי יהיו בחירות בישראל. עשיתי גם קצת מיש-מש בשנות ה-2000 כאשר היו בחירות נפרדות לראשות הממשלה ולכנסת. ההנחה הייתה שזה עלול להשפיע בשני המקרים, כך שצריך לחלק את התקופות לתקופות נפרדות (בין בחירת ברק לנפילת ברק ועליית שרון, ובין עליית שרון לבחירות הבאות בכנסת).
תקיפות/פעולות שנלקחו בחשבון
* דין וחשבון (יולי 93) * תקיפה בבקאע, 30 פעילי חזבאללה נהרגים (יוני 94) * ענבי זעם (אפריל 96) * תחילת האינתיפאדה השנייה (ספטמבר-אוקטובר 00) * חומת מגן (מרץ 02) * דרך נחושה (יוני 02) * תקיפה במחנה פליטים בסוריה (אוקטובר 03) * קשת בענן (מאי 04) * ימי תשובה (ספטמבר 04) * מבצע רקפת (תקיפת כור בסוריה, ספטמבר 07) * מלחמת לבנון השנייה (אוגוסט 06) * גשמי קיץ (יוני 06) * ענני סתיו (אוקטובר 06) * חורף חם (פברואר 08) * עופרת יצוקה (דצמבר 08) * תקיפה אווירית בסודאן (ינואר 09) * תקיפה אווירית בחרטום (אוקטובר 12) * עמוד ענן (נובמבר 12)
שלום נ.ש, נעים להכיר.
תודה על הכתיבה המפרגנת (בסך הכל).
כמה הערות:
1) מוסכם. אלו הנתונים שמצאתי. גם ראוי לציין שרקטות הם כלי שהתחילו להשתמש בו רק בעשור האחרון בעיקר, ובכל מקרה בשביל להשוות תקופות נוספות היינו צריכים סוגים נוספים של נתונים.
2) מוסכם לחלוטין.
3) ולאחר מכן היו סטטיסטיקאים אחרים (אגב, מהמחלקה שלי באונ', ת"א), שכתבו תגובה למאמר ההוא וטענו שהחוקרים טעו.
http://www.pnas.org/content/108/15/E53.extract
אח"כ החוקרים מהמאמר המקורי הגיבו להם, אבל מהמעט שבדקתי את הנושא, התגובה לתגובה לא הייתה מספקת בשביל לענות על המגבלות.
בקיצור – הייתי יורד מהסתמכות על המחקר שציטטת.
4) לגבי ההצעה שלך – אכן, ההחלטה כיצד לבחור מבצע היא בעייתית. אבל ציינת זאת.
מעבר לזה עולה השאלה מדוע לבחור דווקא 12 תאים? (ולא 10, או 365*4?)
ובנוסף, וזו בעיה מהותית, אתה לא יכול להשוות את ההתפלגות הזו לאחידה, היות והמבחן שסביר שתשתמש בו יניח אי-תלות של התצפיות. ואני חושב שזה ברור לך ולי שיש מרכיבי תלות בין התצפיות הללו (או חיובית או שלילית. חיובית: כי מבצע כושל עלול לגרור מבצע נוסף בשביל לסגור את המשימה. וקורלציה שלילית כי מבצע מוצלח יכול להוביל לתקופת שקט שתצדיק חוסר התחלה במבצע נוסף)
וכמובן שגם שאר הסייגים שכתבת הם לעניין.
לתימצות: זה מתסכל מאד (כפי שייתכן ואתה חש בעצמך), להסתכל על כאלה נתונים ולא לצאת הרבה יותר "משכיל" מאשר כשהתחלת. זה בערך מה שאני מרגיש. אבל מצד שני, ניסינו 🙂
ולפחות פתרנו את עצמנו מהאפשרות שמדובר כאן בסיפור מאד פשוט שמספיק כמה ניתוחים כדי להבינו. הסיפור פה הוא לא פשוט.
בברכה,
טל
שלום טל, נעים נעים,
1. מסכים, הסכמנו.
2. הידד.
3. תודה על הקישור, לא הכרתי את המאמר ההמשך והתגובות לו. אני אתקן בהתאם (נראה לי שאשאיר את הקישור המקורי ואציין את הדברים שאתה מביא כאן. אני חושב שעדיף להראות שלא הבאתי את התמונה המלאה במקום פשוט למחוק – נשמע סביר?)
4. א) לגבי התאים: נקודה טובה. כפי שאמרתי, הבחירה היא שרירותית משהו, וזה עניין של רזולוציה. יש כל-כך מעט נקודות מידע שאם הייתי בוחר נניח 365*4, רוב התאים היו ריקים. אם לעומת זאת הייתי בוחר 2 תאים ('לפני בחירות', 'אחרי בחירות') יכול להיות שהיו מתלוננים שזאת רזולוציה נמוכה מדי. ניסיתי לשחק עם מספר התאים, אם מגדילים אותם זה פשוט נראה מפוזר, אם מקטינים אותם זה נראה עדיין בערך יוניפורמי, בטח שלא רואים עלייה לקראת הבחירות.
4. ב) אני מסכים שיש הרבה בעיות עם ההנחה היוניפורמית. זה מודל לא מציאותי מהרבה בחינות – ישראל לא פשוט בוחרת לתקוף באופן אקראי במהלך השנה. עם זאת, אני לא בטוח עד כמה חשובה תלות בין המבצעים (אם תשים לב למבצעים, רובם לא ממש 'קשורים' זה לזה) לעומת תלות בגורם נסתר – איזשהי הסלמה כללית, או 'תקופת אלימות' כפי שנכתב במאמר שקישרת אליו. למשל, כל האינתיפאדה השנייה היא 'גורם' למבצעים, אפילו אם הם בלתי-תלויים בהינתן הגורם הזה.
אפשר לחשוב על זה גם כך: בהינתן סכסוך אינסופי (כחכוך גרון) ו'גורמי ליבוי' שמפוזרים באקראי במהלך הסכסוך, אין סיבה לחשוב שתהיה הצטברות של מבצעים דווקא לקראת תקופת בחירות – אפילו אם המבצעים תלויים קצת זה בזה. לעומת זאת, אם תקופת הבחירות משחקת איזשהו גורם, אז אנחנו כן היינו אמורים בהינתן מידע רב לראות את הסיגנל הזה.
כרגע אין מספיק נתונים על-סמך הניתוח הזה להגיד ש'ברור שלקראת בחירות יש הסלמה/תקיפה'. גם אין מספיק להגיד שבוודאות לא.
ואכן, זה מסתכל. אני חושב שהשורה התחתונה היא: נסכים להסכים.
קיבלתי הכל.
מה יהיה איתנו, אין לנו שום דבר מרגש לא להסכים עליו 🙂
רק אדייק – לגבי היוניפורמיות, הנחת אי-התלות היא כן חשובה, הצורה הפרמטרית של ההתפלגות פחות, הנחת האי-תלות היא קריטית בשביל מבחני השערות מהסוג שלרוב מלמדים בקורסים.
עוד נקודה טובה לגבי רוב המבחנים, אם כי בסופו של דבר נמנעתי מהפעלת מבחנים שנופפתי בהם בהתחלה – באמת שלא ראיתי סיבה. אם אין עלייה במסה לקראת הסוף, זה לא כזה משנה לי למה אני משווה, בין אם זה יוניפורמי או לא בדיוק.
אבל אם אנחנו כבר דנים בנושא, עד כמה זה משנה חוסר התלות אם אני עושה סלקציית מודל לפי פקטורים בייסיאנים? כלומר, אם יש לי מודל שנותן לי הסתברות מסויימת שהיא במקרה יוניפורמית זה לא כזה משנה אם הגעתי לזה דרך תלות מסויימת, כל עוד אני יכול לתת לכל פיסת מידע הסתברות מסויימת, ולהשוות את ההסתברות הזאת למודל חלופי.
אני חושב שחלק מהבעיה היא שאם יש תלות אתה פשוט לא תצפה להתפלגות יוניפורמית, ולכן זה לא מודל חלופי טוב. אפשר אולי גם לתקן לאור זאת את מה שאמרתי לגבי 'סכסוך אינסופי':
אם יש גורמי רקע ששולטים על מבצעים וגורמים להם להראות תלויים זה בזה בלי ידיעת גורמי הרקע, עדיין נצפה בהינתן סכסוך אינסופי להתפלגות יוניפורמית, כל עוד גורמי הרקע עצמם מופיעים באקראי. לא?
אבל אם יש באמת תלות בין מבצעים בלי קשר לגורמי רקע, אז מודל יותר טוב יכול להיות איזה HMM, ובהינתן סכסוך אינסופי אולי נקבל איזה התפלגות מנוחה/יציבה שאיננה יוניפורמית. כמובן, לא ברור שעבר מספיק זמן להגיד שהגענו לאותו מצב, וגם אם ההתפלגות לא יוניפורמית לא נצפה שהיא תהיה מוטה דווקא לתקופת הבחירות, כך שאם נשים התפלגות א-פריורי על כל ההתפלגויות המוטות שיצאו לנו ממודל שכזה, נגיע שוב פעם ליוניפורמית?
בכל מקרה, זה הרבה השערות לא רלוונטיות ופשוטות מדי שאני סתם לוקח לקיצוניות. הידד לאקדמיה.