טוויטר מעבר לתוכן – הפיזור הגיאוגרפי של עיתונאים ומילים

מאת נביא שקר

לפני לא הרבה זמן יצרתי טוויטר-בוט בפעם הראשונה, וזה נתן לי מעט כוח לעשות דברים שלא יכולתי לעשות אחרת. עם כוח מועט, באה אחריות מועטה.

תהיתי מה אפשר לעשות עם מידע מטוויטר (חוץ מזה). למי שלא בטוח אם הוא רוצה לקרוא הלאה: הפוסט הזה הוא סיכום של כמה חתכים פשוטים. אני עובר מאיכון מטריד קצת של מר רהב, לשעות הפעילות של עיתונאים שונים, למיקום גיאוגרפי של אנשי תקשורת, ומסיים במפת המתארת את המיקום של המילה ׳אוף׳ לעומת המילה ׳כיף׳, עם מסקנה מאוד זהירה שחולון זה באסה.

1) למשל, אחד הדברים הבסיסיים שאפשר לעשות זה איכון – מציאות המיקום של מישהו, אם הוא אפשר לטוויטר גישה למידע הזה. מכיוון שהתחלנו את הבוט עם מר רני רהב, נראה לי סביר לתהות מהיכן מר רהב מצייץ. מסתבר שרהב מעדכן רק ממקום בתל-אביב שאני מניח שהוא המשרד שלו, וממקום בסביון שאני מניח שהוא הבית שלו (כלומר, אלה העדכונים שאפשרו גם גישה לאיכון). הנה שניים מהציוצים של רהב בסביון:

rahavloc

האם רהב גר ברחוב הקשת 14 בסביון? על-פי שירות מפות הרחוב של גוגל, הבית שם נושא את שמו, ליד השלט שאומר שהחנייה שמורה ל״רכב קונסול רפובליקת איי מרשל״. אפשר לראות את התזוזות של מר רהב בתוך הבית בעודו מקלל אנשים שונים ברשת, בהנחה שסומכים על רמת האיכון של טוויטר.

זה חביב, אבל זה לא הרבה מעבר למה ש-144 וקצת דימיון היו מגלים לנו. חוץ מזה, קצת נמאס לי ולאחרים ממר רהב, אז לצורך הדוגמאות הבאות אעבור לאנשים אחרים. מכיוון שאני לא ממש מתמצא בעולם הטוויטר אני בוחר את האנשים מהרשימה כאן, שצצה גבוה בחיפוש אחר עיתונאים ופוליטיקאים המשתמשים בשירות.

2) דבר נוסף שאפשר לעשות זה מחזור פעילות. ניקח למשל את גיא רולניק, ונבדוק כמה אלפי ציוצים לאחור. אפשר לשרטט היסטוגרמה של השעות בהן כל ציוץ נשלח ולשרטט נפח פעילות ממוצע:

grolnik

נראה שלמר רולניק יש מחזור ערב ומחזור בוקר, כאשר מחזור הערב מעט יותר משמעותי מהבוקר. אפשר להבין גם בערך מתי הוא קם. תשוו את זה לאלון בן-דוד (נגיד), שיש לו בעיקר מחזור ערב מודגש הרבה יותר, סביב שעת מהדורות הערב של החדשות. אני מניח שאפשר לעשות הרבה חתכים כאלה ולסווג אנשים לפי ׳צייצני בוקר׳ או ׳צייצני ערב׳, אבל אני לא בטוח למי אכפת.

3) אם כבר עוסקים בעיתונאים, אפשר לחזור ולראות את עניין האיכון, אולי הם קצת יותר מעניינים מרהב? יש יחסית מעט עיתונאים שמאפשרים גישה למיקום gps, אבל הנה למשל מאות המיקומים האחרונים של הכתבת סיון רהב-מאיר:

rahavmeir

בעיקר תל-אביב וירושלים. הנה לעומת זאת המיקומים האחרונים של רועי שרון, כתב השטחים של ערוץ 10:

roisharon

אני מקווה שמשלמים לו על הדלק.

4) אפשרות נוספת היא הצלבת איכונים. כלומר, לבדוק אם שני אנשים צייצו בערך באותו מיקום גיאוגרפי. מאוד הייתי שמח לבשר על משהו כמו ״הציוצים של פוליטיקאית איקס נמצאים באותו בית-קפה כמו עיתונאי זד״, אבל לצערי הפוליטיקאים שבדקתי לא הפעילו איכון. הייתי שמח גם לבדוק קשרי הון-עיתון אבל אין לי רשימה מובילה של אנשי הון שמשתמשים בטוויטר. אני פתוח להצעות בנושא.

ובכל זאת, השיטה באופן כללי עובדת, במובן שהצלבתי בין כמה עיתונאים וראיתי למשל שרועי שרון וסיון רהב מאיר צייצו שניהם מאיזור מלון ליאונרדו בירושלים, במרחק של כמה מטרים אחד מהשנייה. ככל-הנראה זה היה על רקע הבחירות לרבנות הראשית. זיהיתי אותם גם יחד באיזור הכנסת (לא מפתיע) ועוד מקום בירושלים שלא בדיוק נראה חשוד.

והנה למשל המיקומים האחרונים בתל-אביב של מואב ורדי, כתב ערוץ 10 (הוא גם נמצא לא מעט בירושלים, וגם למשל במלון אינטרקונטיננטל בז׳נבה):

moavvardi

אם הייתי עוקב אחריו במשך יותר מכמה ימים אני מניח שהייתי יכול לחלץ בתי-קפה אהובים, או משהו בסגנון. גם מהמעט הזה אפשר ללמוד שהוא כנראה גר ברחוב שלמה המלך, ואוהב לבקר (או לפחות, לצייץ) מפינת בלפור ואחד העם. גוגל סטריט וויו מראה שיש שם בית-קפה:

ahathaam

5) נעזוב אנשים ספציפיים, מה אפשר להגיד על קבוצות של אנשים? אפשר למשל לקחת את כל הציוצים של עיתונאים ופוליטיקאים שונים, להרכיב מזה וקטורי מילים ולעשות אשכול היררכי, שמראה מי קרוב למי במרחב השפה. אבל אני לא הולך לעשות את זה, גם כי כבר עשיתי משהו דומה לכנסת לאחרונה, וגם כי שליפת ציוצים זה תהליך ארוך ומוגבל יותר משליפת פרוטוקולים.

6) ועוד יותר כללי מכך, אפשר לראות את הפיזור הגיאוגרפי של מונחים מסויימים. הנה למשל הפיזור של המילה ״אוף״ (באדום) לעומת המילה ״כיף״ (בירוק) בימים האחרונים:

כיף או אוף

נראה שיותר כיף מחוץ לאיזור המרכז – חוץ מדימונה. צריך לסייג שוב ולהגיד שאין הכוונה שאנשים יותר מבואסים באיזור חולון-בת-ים לעומת חיפה וירושלים, אלא רק שמתוך האנשים שמשתמשים בטוויטר, אלה שאפשרו מעקב gps, שצייצו בימים האחרונים…אז נראה שאולי יותר כיף להם מחוץ לאיזור חולון-בת-ים.

===

באחד הפוסטים הבאים אסתכל יותר ברצינות על פיזור גיאוגרפי של מילים ׳חיוביות׳ לעומת מילים ׳שליליות׳.