הטוב, הרע והמשועמם – מילות רגש בטוויטר

מאת נביא שקר

מה החלוקה הגיאוגרפית של מילים חיוביות לעומת שליליות? מה לגבי שעה ביום? האם אפשר למדוד את זה?

בפוסט הקודם ראינו שאפשר להשתמש בטוויטר כדי לעקוב אחרי אנשי תקשורת ולחלץ שעות פעילות, מקומות אהובים, חתכי איכונים וכתובות מגורים.

הפעם נעבור למילים, במקום אנשים ספציפיים. לקחתי רשימה של מילים שליליות (רע, באסה, חרא, דיכאון, גרוע, עצוב, עצובה, אוף, משעמם) ומילים חיוביות (כיף, יופי, נהדר, שמח, שמחה, מצויין, אחלה, מאושר, מאושרת, שמחה), ובדקתי היכן נמצאים האנשים שמאזכרים את המילים הללו בטוויטר ומתי ביום המילים מופיעות.

אזהרה כללית: הניתוחים הבאים מסתמכים על מילים ספציפיות בשבוע האחרון בטוויטר (כמה עשרות אלפי הודעות), והנתונים הגיאוגרפיים מסתמכים רק על האנשים שאפשרו הפעלה של מעקב gps (כמה אלפי הודעות). הניסיון להקיש מכך למצב-הרוח הכללי בישראל בעייתי באופן ברור.

ובכל זאת.

נתחיל משעות ביום. לקחתי את נפח הפעילות של הציוצים ה׳שמחים׳ והחסרתי ממנו את נפח הפעילות של הציוצים ה׳עצובים׳. הנה התוצאה:

זמן עצב

נראה שאנשים בעיקר עצובים בשעות אחר-הצהריים, ובעיקר שמחים בשעות הערב. מאוחר יותר הם צונחים חזרה לדיכאון. זה מתאים לא רע לממצאים ממחקר קצת יותר רציני בארצות-הברית.

למתעניינים בסטטיסטיקה, השטח הכחול מתאר רווח בר-סמך של 90%, שהושג על-ידי שיטת bootstrap פשוטה. למי שלא מתעניין בסטטיסטיקה, השטח הכחול נותן לנו תחושה עד כמה אפשר לסמוך על התוצאה ועד כמה היא מובהקת.

נעבור לחלוקה גיאוגרפית. הנה מפת העצב:

tweetsbad

והנה מפת השמחה:

tweetsgood

מי שקרא את הפוסט הקודם (שלום לשניכם) אולי זוכר שנכתב שם בזהירות שאם משווים את המילה ׳משעמם׳ למילה ׳כיף׳, נראה שיותר כיף מחוץ לאיזור המרכז. אני לא רואה טרנד דומה בענייני שמחה ועצב. נראה שבאילת ובדימונה קצת מבאס, אבל מה עוד חדש.

הלאה. מדוע אנשים שמחים או עצובים, מעבר לשעה ביום? מה לגבי מושא הרגש עצמו? אפשר להסתכל על תוכן ההודעות ולראות אילו מילים מופיעות באסוציאציה חזקה למילים שמחות או עצובות. אחרי שמורידים מילים טריוויאליות כמו ״אני, אתה, יותר״, אפשר לראות שמילים שמחות מגיעות יחד עם:

אמא, מכבי, יום-הולדת, לישון, שישי, ספר, לילה, בוקר, הפועל, מצפה, מאוכזב

אני לא בטוח מה מאוכזב עושה שם, אבל זה מה יש.

מילים עצובות מגיעות יחד עם:

מבחן, ספר, פסיכולוג, רוח, לבד, קר, המטופל, בן-אדם, ילד, בנים, בנות

אולי באחת הפעמים הבאות אני אבדוק את השינוי הגיאוגרפי ככל שמוסיפים יותר ח׳ לביטוי ״חח״.

מודעות פרסומת