ניתוח הרגש של אורי כץ (לבקשת הקורא אלעד אבן)

מאת נביא שקר

א: ״אז מה התשובה?״

ב: ״לא.״

א: ״אתה יכול להרחיב קצת?״

ב: ״לאאאאאאאאאאא.״

====

הקורא אלעד אבן כתב בפייסבוק:

״אני קורא את (כתביו של אורי כץ) כבר כמה שנים, ואין לי הוכחה אמפירית לכך, אך אני חש ש(הוא) הופך יותר ויותר ביקורתי ושלילי…האם זו התפכחות התבגרות, אולי המצב מתדרדר באמת או אולי זה בכלל בעיני הקורא.

נ.ב.
יש בחור שאוהב לעשות ניתוחים ממוחשבים אלגוריתמים לטקסט באופן אנונימי…אז נביא יקר, אם אתה או אחד ממכירך קורא פוסטים אלו אשמח לראות אם ניתוח Bag of words או sentiment analysis לפוסטים של אורי יאשר או יפריך את הרגשתי.״

====

אני לא ממש קורא את הפוסטים של אורי כץ, אבל קצת כמו מיץ-חיפושיות, אם מזכירים את שמי אני מופיע. אני לא מכיר כלים טובים לניתוח רגש (sentiment analysis) בעברית, אז בואו נעשה משהו טיפשי.

כתבתי סקריפט קצר בפיית׳ון שמוריד את כל הפוסטים של אורי כץ, מתרגם אותם לאנגלית, ומעביר את התרגום שורה שורה דרך ניתוח-רגש שאומן על ביקורות סרטים וטוויטר ודברים כאלה.

רעיון רע, אני יודע. גם אם היה איזשהו אות במקור אני לא ממש סומך על ניתוח-רגש שידע לחלץ אותו, ותרגום אוטומטי בטח גם פוגע בזה. אבל זה הדבר המהיר שיכולתי לעשות, והנה התוצאות:

katz1

הגרף מתאר את הרגש הממוצע של כל פוסט, לאורך הפוסטים.

למי שלא אוהב להיות ממוצע, אפשר לראות את זה גם בתור boxplot:

katz2

באופן כללי נראה שעל-פי הניתוח הזה אין הבדל לאורך הזמן (ואפשר לחתוך את זה סטטיסטית בדרכים שונות). אני מדגיש שוב שזה לא אומר שאין באמת הבדל, אלא רק שלפי הניתוח הדי מצ׳וקמק הזה לא רואים הבדל.

אפשר גם לעשות הבדלים יחסיים. למשל, ארי שביט קצת יותר שלילי בממוצע מכץ (או קצת פחות חיובי). זאת תוצאה מובהקת, אבל האפקט הוא מאוד קטן. שביט גם נעשה טיפה יותר חיובי לאורך הזמן, אם מסתכלים על החציון.

מודעות פרסומת