נביא שקר

הנבואה ניתנה לשוטים

״בכיר הטריד מינית״ – פיצוח גוגל

״בכיר בלשכת נתניהו נחשד בתקיפה מינית, דיווחו כלי התקשורת.

מכיוון שאסור להם לפרסם את שמו (נכון לשעה זו), אנשי התקשורת מסתפקים בתמונה מטושטשת, למשל באתר ברשת:

12112

מעניין מה קורה אם עושים ״חיפוש גוגל הפוך״ על התמונה.

היי, תראו מה מצאתי באתר ערוץ שבע:

62380

מעניין.

raw.gif

גְּלִימָה לְכָה, קָצִין תִּהְיֶה לָּנוּ

[דו-שיח שהיה בערך, לפי אי אילו שנים עם ידיד בצבא]

[[התמונות נעשו לבקשתי על-ידי משתמשת באתר fiverr]]

אני: הלוואי שהייתי יכול ללבוש גלימה.

יותם: אתה יכול ללבוש גלימה.

אני: מאיפה אני אקנה אחת?

יותם: תזמין, בטח יש אתרים.

אני: אולי. זאת לא הפואנטה. זה לא לגיטימי ללבוש גלימה בימינו.

יותם: בצדק, זה לא פרקטי בכלל.

אני: מה לא פרקטי? וחוץ מזה, הכל צריך להיות פרקטי? כובעים זה פרקטי?

יותם: כן.

אני: גלימה זה מחמם בחורף.

יותם: גם מעיל מחמם בחורף. וחוץ מזה, אם אתה רוצה שגלימה תחמם אותך אתה צריך להכניס את הידיים שלך פנימה. אי אפשר לעשות כלום ככה.

אני: אז תוסיף לגלימה שרוולים.

יותם: מזל טוב, המצאת את המעיל.

אני: יודע מה? גלימה לא אמורה להיות עם שרוולים. זה אמור להתנופף מאחוריך.

sol_1.jpg

יותם: זה דבילי.

אני: גם כומתה זה דבילי, למה יש לנו כובע שמחמם את הכתף?

יותם: ידוע שהכתף זה האיבר הכי חשוב. אבל אתה צודק, כומתה זה דבילי.

אני: נו, אז אולי הצבא יאמץ גלימות?

יותם: רעיון. בטירונות כולם יקבלו גלימת סקביאס מגעילה ונפוחה כמו שמיכת פוך.

אני: נכון. אנשים יבלו שבועות בניסיון להשטיח את הגלימה שלהם. שפצור גלימה.

יותם: ותיקים יתהדרו בגלימה ההדוקה-אל-הגוף. וכמובן, יהיו גלימות בצבעים שונים.

אני: גלימות כתומות, גלימות סגולות!

יותם: אולי מישהו סוף-סוף ירצה להצטרף למשטרה הצבאית.

sol_4

אני: אתה מתאר לעצמך עדר של צנחנים מסתערים עם גלימות אדומות?

יותם: הצבא יהפוך לענן פרפרים קטלני.

אני: תהיה כמובן גלימה א׳ וגלימה ב׳.

sol_3.jpg

יותם: ברור. גלימה א׳ למסדרים, מבריקה וחסרת קרעים.

אני: גלימה ב׳ לפעילות מבצעית אמיתית.

יותם: קצינים יקבלו גלימה קצת אחרת.

אני: אולי אפשר לשים סמל של החיל או החטיבה מאחורה.

יותם: גלימות אפורות עם עורבים שחורים לקציני חיל אוויר.

אני: אנשים ירוצו לחתום קבע. ואז לאט לאט זה יחדור לאזרחות, ואני אוכל ללבוש גלימה.

so_1.png

יותם: כן, בדיוק כמו כומתות.

מדד השמאלנות המנורמל

 בימים האחרונים אביגדור ״אני אפיל את סכר אסואן על איסמאעיל הנייה״ ליברמן מציע לבנות בגושי ההתנחלויות במקום במקומות מבודדים כמו עמונה, ומתויג כ׳שמאלן׳ על-ידי אנשים שחושבים שהם ימינה ממנו.

תהיתי עד כמה הכינוי הזה מודבק לאנשים שונים במערכת הפוליטית. בדקתי כמה תוצאות אפשר למצוא בגוגל אם מקלידים ״איקס הוא שמאלן״ או ״איקס הוא שמאלני״ או ״איקס שמאלני״ או ״איקס שמאלן״, אם מחליפים את ׳איקס׳ בשורה של אנשים מהמערכת הפוליטית.

הנה התוצאות:

leftist1

כאמור, ׳מדד השמאלנות׳ בציר הוואי הוא סכום מספר תוצאות החיפוש בגוגל עבור כל הביטויים האלה.

יש משהו קצת לא הוגן בגרף הזה, כיוון שהוא לא לוקח בחשבון את העובדה שיש אנשים שהם יותר פופולריים במנועי חיפוש בלי קשר לכינויי גנאי. לאור זאת יצרתי ׳מדד שמאלנות מנורמל׳, שהוא פשוט מדד השמאלנות מחולק בכמות התוצאות שגוגל מחזיר עבור השם של הדמות הפוליטית בלי קשר לכינוי הגנאי.

הנה התוצאות:

leftist2

אפשר להסיק מזה כל מיני דברים. התחושה שלי אישית היא שאם היה מדד יותר ׳אמיתי׳ למיקום בציר השמאל-ימין, אז ׳מדד השמאלנות המנורמל׳ היה יוצר פונקציה בצורת ח. כלומר, אנשים שהם באופן ברור שמאל לא מתוייגים ככאלה באופן מגנה, ואנשים שברור שהם ימין בצד הקיצוני גם לא מתוייגים ככאלה. אבל אנשים בימין-מרכז הם בדיוק המטרה לכינויים האלה.

דנה ספקטור, פרשנית

דנה ספקטור הצטרפה לאחרונה לפאנל של ערוץ 1, בתכנית ׳יומן׳ המסכמת את אירועי השבוע. לא לגמרי ברור לי על תקן מה ספקטור יושבת שם, אולי בתור מוח-הכוורת של טוויטר?

למשל, יום לפני הפאנל, ה-27 לאוקטובר:

Screen Shot 2016-11-13 at 9.41.59 PM.png

או יום שישי, פאנל ה-4 לנובמבר:

screen-shot-2016-11-13-at-9-41-08-pm או כמה ימים לאחר מכן:

Screen Shot 2016-11-13 at 9.42.35 PM.png

מצד שני, רוב הפרשנים הם פוסט-הוקרים במקצועם, אז אולי זה לא משנה בכלל.

End-to-end stock predictions with deep learning

Brief summary of the post for those wondering whether to bother: I trained a neural network that takes in images of stock data like this…

yum11

…and outputs whether that stock will go up or down over the next year. On the way, I make some remarks on end-to-end learning.

====

There's a current craze within the current craze of machine learning and AI, which focuses on end-to-end learning. Roughly speaking, this is the attempt to go from raw perceptual input to the desired output with as little knowledge engineering as possible.

To give an example, suppose you were trying to teach an AI to drive a car***. You could try to factor the problem: I need to detect lanes, other cars, people, and signs. I need to figure out people's plans, I need to parcel my actions into the following sub-goals, etc. Each of these sub-problems still needs to be solved on its own (and probably you could throw a neural network at these sub-problems), but at a high-level you're making a decision about how the problem breaks down:

endtoend1.png

Contrast this with a somewhat different school of thought:

endtoend2.png

That part in the middle of the figure above is a cartoon stand-in for a deep neural network. The network gets in the pixels of the image, outputs some driving action, and gets rewarded accordingly. The hope/promise is that the network will figure out on its own the necessary features and structures needed to solve the problem, without any 'hand-engineering' by a handy engineer.

(*** I am stealing borrowing this example from Amnon Shashua, the head of the self-driving car company Mobileye, who has a bunch of interesting things to say on the topic)

These two approaches are the ends of a spectrum, rather than two completely distinct factions. Still, there are many people these days who veer heavily towards the 'end-to-end' part. And it is quite alluring: we don't need to know anything about anything, just plug in the input and desired output, and let the machine take care of the rest.

This is partly what got people so excited about DeepMind's recent Nature paper, in which a neural network was able to achieve super-human performance on certain Atari games (like Pong and Space Invaders) through reinforcement learning over the pixels of the input. The 'super-human' part is a bit of a distraction. I mean, if you had a program that explicitly knew about things like "this is the space invader sprite" and "you are the defense-turret and when you shoot it does X", then of course you could achieve super-human performance. Such a result would barely register as a worthwhile paper in a conference, let alone a prestigious journal. The wow-factor had to do with the notion that you didn't have hand-craft explicit stuff like "you are the paddle", or even what a paddle was.

breakout.gif

DQN training to destroy humanity

I think it's an open question whether the network described in the DeepMind paper actually learned the representations that allow us humans to play these games successfully. In fact I'm pretty sure it didn't. And it matters, because while end-to-end is quite seductive and works surprisingly OK in certain regimes, I think it is a little insane.

But rather than spend the rest of this post arguing that (I've covered a bit of it elsewhere), let me instead morph into an end-to-end enthusiast, who also wants to play the stock market.

(clarification, everything from here on is still kinda true. Technically.)

======

Gee wiz guys, all this neural network stuff sounds awesome. But how can we make some actual money off of it? I mean besides getting a PhD in Deep Learning and being hired by a start-up.

I know, we'll bet on stocks!

psych

Let's see, we can formulate the 'problem' of stock betting as a system that takes in some data about stocks in the past, and tries to make the right prediction about stocks in the future. Now, I don't know that much about stocks, and I don't want to bias my system by giving it any human-specific notions like 'prices', or 'companies', or 'the concept of time'.

We'll just feed in raw input into the machine in a format it can understand: visual pixels.

I downloaded all the stock data for the Fortune 500 companies going 5 years back, and created 32×32 pixel images that show how a stock fared over 365-day intervals, including the stock name and the min and max of the price (not that the machine knows anything about those, it'll have to discover them on its own if they matter):

yum11

I used 50-day jumps and 365-day intervals, so I had about 10,000 training images. But how should I label them? What counts as a 'good' stock?

There's no one way to answer that. I ended up doing the following: If the stock went up over the 365 days that followed the image (a positive correlation of 0.5 or higher), I labeled it '+1'. If the stock went down (a negative correlation of -0.5 or lower) I labeled  it '-1'. Anything else was labeled '0'. The assumption is that we can turn these labels into useful actions like 'buy', 'sell/short', or 'do nothing'.

Since stocks generally go up (in the dataset, anyway), one can know nothing at all and still predict 70% of the labels just by guessing the maximum-likelihood "+1" all the time. So, 70% accuracy will be our baseline to beat.

To recap:

  • The input is an image of the stock performance over a given span of 365 days.
  • The desired output is -1, 0, or +1 depending on how well the stock did on the *next* 365 days.
  • The number to beat is 70% accuracy.

I took an off-the-shelf convolutional neural-network that can reasonably recognize different animals and threw the problem at it, using TensorFlow.

It didn't work.

I started to think that maybe the stock market present a unique challenge with its long-range beha-

NAH LET'S JUST ADD ANOTHER CONV-LAYER AND FUTZ WITH THE LEARNING PARAMETER LOL.

q8gb6

Here we go:

endtoend3.png

The network achieved 92.3% accuracy on the left-out examples (that is, stock images that it never saw before). For the math-y types out there, 92.3 > 70.

Hooray, let's make money.

Epilogue Q&A

Q1: "But Navisheker, what did the network actually learn?"

A1: I dunno, I guess it extracted the features it needed or something.

Q2: "Wouldn't it be saner to run machine-learning directly on the actual time-series data and company information?"

A2: Sure, if you want to hand-engineer your way to profit go ahead and try. My way doesn't require knowing anything about anything.

Q3: "Surely there's a simpler algorithm for getting a similar result. What if you just predicted that things that went up before tend to go up again?"

A3: That's not end-to-end, get out of here with your old-school ways! But since you asked, if you run logistic regression to try and predict the labels from the linear regression coefficient of the past 365 days, you can get up to 84%, which is not as good.

עיתונאי בכיר? כתב חידה ותרשים זרימה

לפני שבוע דניאל ברין פירסמה כתבה בה היא סיפרה על סיטואציה אליה היא נקלעה עם ׳עיתונאי ישראלי בכיר׳. העיתונאי שלח ידיים,  ביקש ממנה לעלות לחדר, הציע לה להיות המאהבת שלו, גרם לה להרגיש לא בטוחה, ובאופן כללי נשמע שזה היה סיפור שכולו…

yuck.gif

ברין לא ציינה באופן מפורש במי מדובר, אבל היא כן רמזה רמזים. בעזרתם, הרכבתי תרשים זרימה שיעזור לנו לצמצם את החשודים האפשריים. כל חץ בתרשים מוביל לרמז או לקבוצת החשודים המצומצמת. כך, בסדרת צעדי דדוקציה לוגית נוכל להגיע קרוב יותר לפתרון התעלומה:

חשודמאוד.png

הממממממ…

giphy.gif

״השתנתי במכנסיים״: 7 שיטות שמאלניות בהן משתמש אתר הארץ כדי לגרום לכם לעשות משהו שאתם לא רוצים לשמוע עליו, וזה סקסי להחריד

לאנשים נשבר מקליק-בייט. לאנשים אפילו נשבר לשמוע על קליק-בייט. יש כמות מוגבלת של בדיחות בסגנון ״11 דברים שלא ידעתם על קליק-בייט! מספר 6 ימיס לכם את המוח!״.

ולמרות המיאוס, אתרי חדשות עדיין משתמשים בקליק-בייט. בפוסט הזה נסתכל ספציפית על השימוש בקליק-בייט באתר ״הארץ״. לכל ידיעה באתר יש 2 כותרות: הטיזר שמפנה אל הכתבה בעמוד הבית, והכותרת ה״אמיתית״ שמלווה את הכתבה אם מקליקים על הטיזר.

דבר זה מאפשר לזהות בקלות את יד העורכ/ת של הטיזרים לעומת עורכ/ת הידיעות (בהנחה שמדובר באנשים שונים בכלל).

לדוגמא, לאחרונה התגלה כי פגיון של הנער-המלך תות-אנך-אמון עשוי ממטאוריט. הנה כותרת הכתבה:

חוקרים: הפגיון המסתורי של תות ענח אמון עשוי ממטאוריט

למרות השימוש המיותר משהו במילה ׳מסתורי׳ מדובר בכותרת עניינית, אפשר להבין ממנה על אודות מה הכתבה ולהחליט אם לקרוא אותה.

והנה הטיזר שקישר לכתבה בעמוד הבית:

נפתרה תעלומת הפגיון של תות אנח אמון: "מוצאו מחוץ לכדור הארץ"

aliensguy

וואו! מחוץ לכדור-הארץ, מה זה יכול להיות?! אני משתין במכנסיים מהתרגשות, וזה אפילו לא סוף השבוע!

תעלומה, ציטוט ישיר, הסתרת מידע. זה בהחלט מגרה את הסקרנות, אבל הרבה פחות אינפורמטיבי. קליק-בייט קלאסי.

אני יכול להבין את העורכ/ת. כשמדובר בעיתון פיזי, הלקוח קונה או לא קונה את כל החבילה. מהרגע שהוא קנה את העיתון זה כבר לא בעיה שלך אם הוא בוחר לקרוא כתבות ספציפיות. אבל בתור עורכ/ת האתר, צריך להפוך כל כתבה למשהו מושך.

אבל עם ההבנה והסימפטיה, קליק-בייט זה חרא. תהיתי עד כמה העניין נפוץ ב״הארץ״, אז הורדתי את כל גרסאות אתר הבית שיכולתי למצוא בין השנים 2015-2016 (בעזרת הארכיון הזה). מכל גרסא חילצתי את ההפניות (הטיזרים) ואת הכותרות ה״אמיתיות״ של הכתבות אליהם הטיזרים מובילים. לא כללתי בניתוח כל מיני כתבות שבעיני לא חייבות להיות בעלות כותרת אינפורמטיבית (כתבות פרשנות, דעות, שירים וכו׳).

אחרי הסינון, נותרו 750 כותרות ו-750 טיזרים. אחרי מעבר ומעבר חוזר, הנה כמה מסקנות:

  1. בערך 25% מהכותרות והטיזרים מכילים קליק-בייט באיזשהו אופן. אני מגדיר קליק-בייט באופן סובייקטיבי למדי כמשהו לא הכרחי שמנסה לגרום לקורא הפוטנציאלי לקרוא את הכתבה מבלי למסור לו מידע נוסף. ראו דוגמאות למכביר בסוף הפוסט. 
  2. לעיתים הכותרת המקורית כוללת קליק-בייט, ולכן אי אפשר להאשים את עורך הטיזרים. אם מסתכלים רק על המקרים בהם עורך הטיזרים שינה את הכותרת המקורית באופן שהופך אותה לקליק-בייטית, מדובר על 17% מהכותרות. האם זה מעט? האם זה הרבה? שני קוראי הבלוג יכולים להחליט לבד.

מעבר למספרים, מעניין לבחון את תת-סוגי הקליק-בייט המראים את טעם העורכ/ת ומה הוא חושב שימשוך קוראים. הנה כמה קטגוריות נפוצות, ורוב הטיזרים מתאימים ליותר מקטגוריה אחת. כל דוגמא מציגה את הכותרת המקורית, ואז את הטיזר. התהליך הוא הפוך לתהליך הקריאה בו רואים קודם את הטיזר ואז את הכותרת המקורית, ומדמה יותר את התהליך שהעורך עובר:

השמטת שמות ופרטים

העורכ/ת ככל-הנראה חושב שהשמטת שמות יוצרת אווירה של מסתורין ומגרה סקרנות, אחרת קשה להסביר למה הוא משתמש בכלי הזה. לרוב לא מדובר בקיצור הכותרת.

דוגמאות

הרשות למלחמה בסמים פתחה בקמפיין בעד קנביס רפואי
=> התומכת המפתיעה בקנביס רפואי

הבגט המסורתי
=> 280 גרם של אושר: המוצר עם הרגולציה הקשוחה ביותר בצרפת

הניצחון המוסרי של הספר "מלחמת העולם השנייה"
=> אי אפשר לתאר את מלחמת העולם ה-2 בספר אחד. הנה היוצא מהכלל

קפה הבימה: הבועה התל אביבית בשיאה
=> כשהבועה התל אביבית מכתירה כריך טרנדי

במקום קוקה קולה, מסנני מים: הספורטאים שמסרבים לפרסם ג'אנק פוד
=> יש דברים שהשחקן הכי טוב בעולם לא מוכן לפרסם, גם עבור עשרות מיליוני דולרים

אוליברי היא מסעדה מהזן שלא מייצרים יותר
=> ע
סקית זולה ונדיבה בלב תל אביב, עם קינוח מפתיע במיוחד

להפיץ את נפרטיטי במדפסת תלת ממד
=> במבצע חשאי הודפס בתלת ממד היהלום שבאוסף העתיקות

המתכון להצלחה של השף יותם אוטולנגי
=> שף ישראלי חבוי ומצליח מציע מתכונים קלים וטעימים

הזמר דן סמית מביא לבמה זרם תודעה שוצף ודיבור זועם של הומלס
=> הזמר שהמוזיקה שלו נשמעת כמו דיבור זועם של הומלס מגיע להופעה בארץ

גוף ראשון, גוף שני
 הכתבים עצמם הופכים לעיקר בטיזר, אפילו אם הכותרת המקורית לא מנוסחת בלשון זו, וגם הטיזר פונה ישירות אל הקוראים.

דוגמאות

מאיר אדוני מטביע את קיסריה בשמן
=> הצילו! מאיר אדוני הטביע אותי בשמן

מתחם שרונה: כל מה שרע במקדש החדש של תרבות הצריכה
=> בתי בובות מפוחלצים מהגיהינום: כך ברחתי מבועתת משרונה‎

משפטי הגנגסטרים בניו יורק, המחלקה הגריאטרית
=> הגנגסטרים המזדקנים של ניו יורק פונים אל הלב שלכם

סרט האימה הלירי ביותר
=> קשה לצפיה: סרט האימה הלירי ביותר שאני מכיר

מספרים ורשימות

טריק ידוע שלא ברור כל-כך למה הוא עובד, העורך מעדיף מספרים מדוייקים.

דוגמאות

השוערים המיוחדים ביותר בהיסטוריה
=> 11 שוערים יוצאי דופן בהיסטוריה

אפסים כפולים: ההיסטוריה החשאית של המרגלים
=> הייתכן שישראל באמת שלחה 14 סנאים לרגל באיראן ב-2007?

איך למצוא אהבה ברשת?
=> 31 טיפים להצלחה באתרי היכרויות

מודיעין ראויה לעסקיות טובות יותר
=> 86,970 תושבי מודיעין ראויים לארוחה עסקית מבאסת פחות

כיצד תצמצמו את ההוצאות על חופשה משפחתית בישראל
=> 6 טיפים שיסייעו לכם לחסוך הרבה כסף על חופשה בישראל

מסיבת התכרבלות: איך זה נראה מבפנים
=> מסיבת התכרבלות: איך נראות 3 שעות של מגע עם זרים

כל מה שקשור למדע, בריאות וטכנולוגיה

האמת שכאן כמעט תמיד גם הכותרות המקוריות הן קליק-בייט. אם כבר הטיזר הוא פי אלף יותר קליק-בייט.

דוגמאות

מנותקים מחשמל? בערבה מציגים אלטרנטיבות
=> מקיבוץ קטורה עשויה לצאת בשורה שתשנה חיי מיליארדים

זחלי חיפושית שמסוגלים לעכל קלקר מעניקים תקווה למאבק באשפה
=> התולעים האלו יכולות, אולי, להציל את כדור הארץ

כמה סקס זה יותר מדי?
=> וכעת לנושא הפופולרי ביקום: כמה סקס זה יותר מדי?

Note Edge: הסטארטק של 2015?
=> אפקט ה"וואו": מכשיר שמסובב ראשים עם פשרה בלתי נסלחת

חוקרים ישראלים הצליחו לשפר זיכרון של עכברים עם אלצהיימר
=> אופטימיות זהירה: חוקרים שיקמו מנגנונים שנפגעים מאלצהיימר

אהבה משגעת: כשבני זוג מדביקים זה את זה בהזיות שווא
=> ההפרעה הנפשית שמשגעת זוגות

מהכף אל האף: המידע הסודי שמועבר בטקס לחיצת היד
=> המידע הסודי שמועבר במהלך לחיצת היד

העתידן רועי צזנה: האנושות מגיעה עכשיו לסוגיות קיומיות
=> בקרוב נחווה שינוי שהאנושות לא ידעה כדוגמתו. שיחה מטלטלת

מהפך במדע: שמאלנים נהנים יותר
=> המדענים מצביעים על מהפך: שמאלנים נהנים יותר

האנליסטית על ההאקרים שיצילו את העולם
=> חולצה שלבשתם לפני עשור בתמונה בפייסבוק עלולה לשנות את חייכם

פנאי או עבודה
=> סוד ההצלחה של נישואים ארוכי טווח לא קשור לאהבה

איך לבלות במידברן ולהישאר בתחתונים
=> היו אורגיות במידברן, כן. אבל זה לא העיקר

פרופסור ישראלי מציע גישה מהפכנית לגמילה מסמים
=> "ומה אם אומר לך שיש חומר שעושה ריסטארט למוח?"

הפתרון הסיני להעתקות במבחנים: מזל"טים מעל הכיתות
=> הפתרון הסיני להעתקות במבחנים

כך מגדלים בישראל גוג'י
=> מזון-על ב-200 שקל לקילו, "מחולל פלאים בגוף", תוצרת ישראל

האם חייבים לדבר על הכל בזוגיות?
=> שני נושאים שאסור לדבר עליהם עם בני הזוג

הדרך הטובה ביותר לבחור נעלי ריצה
=> הדרך הטובה לבחור נעל ריצה היא כל כך פשוטה שזה מצחיק

האם יש מצב שבו בני זוג אוהבים זה את זה באותה המידה
=> סוד האהבה האידיאלית

הנה התשובה המחקרית לשאלה: מה נשים באמת רוצות?
=> המדע פענח את התעלומה: מה הדבר האחד שאשה רוצה מגבר

מצחיק, גדול, מסתורי

נהדר, מחריד, נדיר, חריג, מרגש, מסוכן

דוגמאות

לאחר המעצרים, ג'ון אוליבר תוקף מחדש את פיפ"א
=> המעצרים גרמו לג'ון אוליבר לצחוק שוב על פיפ"א. וזה נהדר

פרק סיום "משחקי הכס": "תמיד יכול להיות יותר גרוע"
=> פרק סיום "משחקי הכס": דם והשפלות – ותפנית מחרידה

הצייר מתן בן כנען זכה בתחרות הדיוקנאות של נשיונל פורטרט גלרי בלונדון
=> הדבר המדהים ביותר שאתם רואים כאן, הוא שלא מדובר בצילום

לעמוד דום בים: מתרחצים בחוף ברוסיה מופתעים לשמע ההימנון
=> תיעוד חריג של המתרחש בחוף עיר הנופש סוצ'י מעורר הדים ברוסיה

בלי לצאת מהאטמוספרה: סיור בתחנת החלל הבינלאומית
=> לגעת בכל בורג: סיור פנורמי נדיר בתחנת החלל

דקל, סירה ומנורה: חפירות להקמת גן ילדים חשפו מקווה עם כתובות מסתוריות
=> ברגע האחרון: חפירות הצלה חשפו מקווה עם כתובות וציורים מסתוריים

אובמה הכריז על הידוק הפיקוח על מכירת כלי נשק
=> אובמה מחה דמעה כשהכריז על הידוק הפיקוח על מכירת כלי נשק

"בנות בצריח" יוצאות לסיור מורשת קרב בלב הטירוף הישראלי
=> שתי חיילות מסתוריות עורכות סיורי מורשת קרב מופרכים

סרט הטלוויזיה על "צער גידול בנות" נהפך לבדיחה בטוויטר
=> סרט על כוכבי "צער גידול בנות" הפך לבדיחה הכי מצחיקה ברשת

חיישן ניטור השינה החדש של סמסונג פותח ועוצב בישראל
=> החיישן מתחת למזרן שעושה פלאים

איך נראה דוב קוטב מתחת למים?
=> המרדף אחרי תמונה מסוכנת ובלתי מושגת

מי זו חברת "PROBABLY" שמפרסמת על השלטים בזמן משחקי היורו?
=> מי זו חברת "Probably" המסתורית שמפרסמת בזמן משחקי היורו?

יום האשה: אילן פלד מראיין את נחמה ריבלין
=> יום האשה: אילן פלד מראיין את נחמה ריבלין. יצא קאלט

סנדרס וקלינטון שברו מוסכמות, והתחרו על קולות הפלסטינים
=> התנגשות חזיתית נדירה

הנהג שהסיע את המחבלים שרצחו שוטרת בירושלים מואשם בגרימת מוות ברשלנות
=> אישום חריג: נהג שהסיע מחבלים מואשם בגרימת מוות ברשלנות

יש ספק? אין ספק

עניין קטן יחסית לשאר הדברים, אך העורכ/ת לעיתים משמיט או משנה מילים באופן שמוריד את הנויאנס. אפשר לטעון שמדובר בקיצור הכרחי, אך מכיוון שלעורכ/ת אין בעיה עם כותרות ארוכות זה טיעון זה קלוש.

דוגמאות

הלינץ' בגולן: ממדי התקלה מתגלים, וההשלכות עלולות להגיע גם לסוריה
=> הלינץ' בגולן: ממדי התקלה מתגלים, וזה ישפיע עד סוריה

מחקר גנטי משלים את הפאזל של הקהילה היהודית מהודו
=> מחקר גנטי פתר את תעלומת מוצאם של בני ישראל מהודו

מחקר: אכילת ירק שהושקה בקולחים מותירה שאריות תרופות בגוף
=> מחקר: אכילת ירק שהושקה במי קולחים מותירה תרופות בגוף

נתניהו בקבינט: יש להיערך לאפשרות של קריסת הרשות
=> נתניהו בקבינט: יש להיערך לקריסת הרשות הפלסטינית

אשכנזים שמאלנים

העורכ/ת מניח/ה שפוליטיקת זהויות זה דבר שמושך קליקים.

דוגמאות

ההיסטוריה המסריחה של ההיגיינה בארץ ישראל
=> גזענות, התנשאות ועליונות אשכנזית: ההיסטוריה המסריחה של ההיגיינה בארץ ישראל

כשחייל מעז לדבר בגנות הכיבוש
=> כשמדובר בחייל שמאלני, צה"ל יודע להגיב מהר

סדרה מצרית חדשה בוחנת גבולות חופש ההומור
=> סדרה מצרית חדשה בודקת את גבולות ההומור של השמאל

החינוך הפוליטי מוכנס לבתי הספר במסווה לא פורמלי
=> עיוות ההיסטוריה: כך מוכנסת אג'נדה ימנית למערכת החינוך

שוטר עיכב שלושה צעירים בגלל תלונה על רעש, הפשיט וכבל אותם שעות בתחנה
=> 3 קיבוצניקים שהאזינו למוזיקה בת"א הופשטו ונכבלו במשטרה שעות

האיש שהפך את "זגורי אימפריה" לאופרה
=> האיש שהפך את "זגורי אימפריה" לאופרה מדבר גם על המאבק המזרחי

ונסיים במזג האוויר

התחזית ליום חמישי: יוסיף להיות חם מהרגיל
=> התחזית: חם לאללה

ritterroll

Can you caption better than a 4-year-old?

(In English this time)

I recently tried the limits and failure-modes of Microsoft's new CaptionBot. It seems that CaptionBot doesn't really understand what it is looking at.

There are a few counters to that conclusion:

A) Neural networks see the world differently than we do, man!

B) Pfft. The neural-network behind CaptionBot just wasn't trained on enough data.

C) You need to be more forgiving and nurturing. Neural networks are like precious children,  figuring out the world for the first time.

To which I say:

A) Maybe, but then the PR surrounding it shouldn't be "Our bot understands the content of images", but more like "Our bot sort of gets image-classification, and can sort of link that up to Flickr-type captions, if the images are similar to a dataset we trained on".

B) Nonsense.

C) This post.

I managed to secure a 4-year-old's attention for about 20 minutes, and asked him to tell me what was in a series of photos ("describe what you see").

I offered encouragement, but not feedback.

Then I asked CaptionBot to do the same.

Here are the results:

unnamed (9)

4YO: This is a castle and these are buildings and that’s a wall and that’s a sign, and there’s grass

CaptionBot: I think it's a large stone building

unnamed (8)

4YO: I see a eagle and people are falling into the water, and that’s Moses, and those are the bad guys in the water

CaptionBot: I am not really confident, but I think it's a group of stuffed animals

unnamed (7)

4YO: The lion is trying to eat that person up

CaptionBot: I am not really confident, but I think it's a cat playing with a toy

unnamed (6)

4YO: People are pulling the horse with carriages, and they’re pulling it and pushing it and pulling it and pushing it, cause they want to break other people with that horse, and he’ll step on them, and he likes the nice guys

CaptionBot: I am not really confident, but I think it's a group of men standing next to a horse

unnamed (5)

4YO: They’re fighting. That’s Alexander and he’s going to win. He’s holding the bow, the arrow in his mouth. These guys have swords and shields

CaptionBot: I am not really confident, but I think it's a couple of giraffes that are next to a book

unnamed (4)

4YO: The Israelites. They’re tired and they’re walking and they don’t want to live in their land

CaptionBot: I think it's a group of people sitting in front of a building and they seem😐😐😐

unnamed (3)

4YO: People fighting with dragons. The dragons might blow fire on them and eat them. And they’re opening their mouth

CaptionBot: I am not really confident, but I think it's a vase with flowers in it

unnamed (2)

4YO: A kayak, and this guy wants to throw that big rock at the kayak to make it sink it and break it

CaptionBot: I am not really confident, but I think it's a sandwich on a rock

unnamed (1)

4YO: It’s Alexander and his great people. There’s lots of horses, alexander is on his horses, dancing

CaptionBot: I am not really confident, but I think it's a group of people standing outside of a building

unnamed

4YO: Hanukah people carrying Hanukah things and stuff

CaptionBot: I am not really confident, but I think it's an old photo of a stone wall

That'll do, CaptionBot. That'll do. 

רב מדי נודרת המלכה: חודשי הרצוג האחרונים

bugi.png

ישיבת הסיעה הראשונה 18.3 

יו"ר המחנה הציוני, יצחק (בוז'י) הרצוג, אמר היום (רביעי) כי אין למפלגה כל כוונה להיכנס לממשלתו החדשה של בנימין נתניהו.  "אני גאה במאבק שניהלנו. אנחנו נהיה תחליף ראוי, אמיתי, בכל התחומים ובכל הנושאים לממשלת ימין קיצוני שזמנה קצוב", אמר בישיבת הסיעה הראשונה שקיים ביחד עם ציפי לבני.

"הליכה לאופוזיציה היא האופציה הריאלית היחידה שעומדת בפנינו"

http://www.haaretz.co.il/news/elections/LIVE-1.2590541

אופוזיציה לוחמת 26.3

אני אמרתי ואגיד שוב, אנחנו הולכים להיות אופוזיציה לוחמת, חזקה ובועטת מול ממשלה מסוכנת שתחריף את הבידוד הבינלאומי, תעמיק את העוני ואי השוויון, תמשיך להפיץ פחד ותהרוס כל סיכוי לאופק מדיני בשנים הקרובות".

"בכלל, אני מציע לכולנו לשחק פחות בכיסאות ותפקידים ולהפנות את תשומת הלב הציבורית לעשרות אלפי אמהות ואבות שגם בפסח הקרוב יצטרכו לעמוד בתורים לתלושים ועמותות כדי שלילדים שלהם תהיה ארוחת חג", אומר הרצוג.

http://www.globes.co.il/news/article.aspx?did=1001022509

שמועות על פגישות 13.4

יו"ר המחנה הציוני, ח"כ יצחק (בוז'י) הרצוג, הכחיש הערב (שני) בתוקף פרסום לפיו נועד עם ראש הממשלה בנימין נתניהו בחשאיות. לפי הדיווח של אילה חסון בערוץ הראשון, הפגישה בין השניים התקיימה לפני ימים אחדים ולא היתה בגדר פגישת עדכון שגרתית בין ראש ממשלה ליו"ר אופוזיציה. לפי חסון, היא נשמרה בסוד אפילו מפני מקורביהם ועוזריהם של נתניהו והרצוג והתקיימה במקום ניטרלי.

הרצוג מיהר להכחיש את דבר הפגישה ומסר הערב כי היא "לא היתה ולא נבראה". במפלגתו מיהרו לפרסם הודעה בה נאמר כי המחנה הציוני "מכחיש מכל וכל את הידיעה שפורסמה בערוץ 1 ואת קיום הפגישה שסופר עליה". גורמים במפלגה הוסיפו כי מדובר "בשטויות במיץ. כלום משום כלום".

http://www.haaretz.co.il/news/elections/.premium-1.2613054

שבת תרבות 18.4

יושב ראש המחנה הציוני, חבר הכנסת יצחק הרצוג, הכחיש הבוקר (שבת) באירוע "שבת תרבות" בתיאטרון הבימה בתל אביב את קיומה של פגישה סודית בארבע עיניים עם ראש הממשלה, בנימין נתניהו, לפני כמה שבועות, כפי שדווח השבוע בערוץ הראשון.

הרצוג אמר: "שוחחתי עם ביבי פעמיים מאז הבחירות, לא הייתה שום פגישה חשאית ביני לבינו". לדבריו, נתניהו היה צריך להחליט עם מי הוא מרכיב ממשלה וברור שהוא מעדיף ימין חרדים. "בכל מקרה לא עברו בינינו שום מסרים", הוסיף הרצוג, "פני מפלגת העבודה לאופוזיציה. ההליכה לאופוזיציה היא לא ברירת מחדל אלא עדיפות, ממקומנו שם נחליף את ממשלת הליכוד בעתיד".

http://glz.co.il/1064-61493-HE/Galatz.aspx

המגעים לא יחודשו 26.4

המקורבים מציינים עוד כי המגעים להקמת ממשלת אחדות לא יחודשו. זאת, לדבריהם, משום שראש
הממשלה בנימין נתניהו מעולם לא התכוון לכך ברצינות.

“לא נראה שהמגעים לממשלת אחדות יתחדשו”, אמר אחד המקורבים, “משום שראש הממשלה בנימין נתניהו לא היה רציני מלכתחילה והשתמש במגעים עם המחנה הציוני כקלף מיקוח”.

לפני החג אמר נתניהו בשיחה עם כתבים מדיניים כי המגעים נפסקו בגלל החקירה. על כך אומר המקורב כי “הם נפסקו כי לא היו רציניים. נתניהו לא יכול להציע להרצוג שום דבר – לא מהלך מדיני ולא תיקים. הוא לא מעוניין באחדות”.

http://www.maariv.co.il/news/politics/Article-539429

ספינים מגוכחים 1.5

אלא שלמרות האופטימיות הזהירה בסביבתו של ראש הממשלה בנימין נתניהו, בסביבתו של יו"ר האופוזיציה דחו גם היום (ראשון) את הטענות שההצטרפות לממשלה נמצאת על הפרק. מלשכת הרצוג נמסר: "הופתענו שהיו כמה שעות שקטות מספינים ושמועות של הליכוד אבל עכשיו נרגענו – אנחנו לא נעסוק יומם וליל בספינים האלה. את אותם משפטים, רעיונות וסיסמאות שמענו בלי סוף בשנה האחרונה ובמקום לעסוק בספינים המגוחכים האלה. אנחנו עובדים כדי להילחם בתקציב הדו-שנתי ולהחליף את השלטון במדינת ישראל".

http://www.haaretz.co.il/news/politi/.premium-1.2930724

נתניהו מאשר מגעים 4.5

ראש הממשלה, בנימין נתניהו, אישר היום (רביעי) כי המגעים להקמת ממשלת אחדות היו רציניים אך נקטעו בטרם הבשילו בשל חקירת יצחק הרצוג. הניסיון להרחיב את הקואליציה נכשל, הסביר נתניהו בישיבת שרי הליכוד, כי יש אחד שלא רוצה – כלומר, אביגדור ליברמן – ויש אחד שלא יכול, יצחק הרצוג.

http://glz.co.il/1064-81486-he/Galatz.aspx

קווים כללים 12.5

"אני יודע מה האמת שלי", כתב קודם לכן ח"כ הרצוג. "כולם אוהבים את המושג 'אחדות', אבל בעיניי מה שקובע היא שאלת הדרך המשותפת. אם אקבל את המנדט לעצור את מסע ההלוויות הבא ולבלום את סכנת החרם הבינלאומי, להחזיר את ארצות הברית ואירופה להיות בנות ברית, לפתוח משא ומתן עם מדינות האזור ולהיפרד מהפלסטינים לשתי מדינות כדי לעצור את מסע הטרור המתמיד – אז אדע שהידיים שלי מחזיקות בהגה".

לאחר שהודה למעשה בקיום מגעים, המשיך הרצוג בפירוט רשימת הדרישות שלו: "אם אקבל מנדט להוריד את יוקר המחיה, להגן על הציבור במתווה הגז, לשמור על בית המשפט העליון, לבעוט לכל הרוחות את החקיקה הגזענית המתועבת – כשזה יקרה אדע שהידיים שלי מחזיקות בהגה".

http://www.ynet.co.il/articles/0,7340,L-4802437,00.html

רשימת דרישות בפייסבוק 13.5

כרזה ובה רשימת התנאים להצטרפות המחנה הציוני לממשלה הועלתה לדף הפייסבוק של יו"ר המפלגה, יצחק הרצוג, והוסרה כעבור זמן קצר. בסביבתו של הרצוג טענו היום (שישי) כי מדובר ביוזמה של עובדת המטה שהעלתה את המסמך ללא ידיעתו. ח"כים ששוחחו עם הרצוג התרשמו גם הם כי לא ידע על הפוסט לפני פרסומו.

http://www.haaretz.co.il/news/politi/1.2942711

שני תיקים לחברי התנועה 15.5

יו"ר המחנה הציוני, יצחק הרצוג, מוסיף לקדם את הצטרפות הסיעה לקואליציה. מקורות בסביבתו הקרובה של הרצוג הבהירו בסוף השבוע כי חרף הביקורת שספג מצמרת מפלגתו, הוא עדיין מעוניין בחבירה לממשלה. "המהלך הזה עדיין יכול לקרות", אמרו, "אם כי הסבירות לכך אינה גבוהה".

הרצוג סבור שהתמיכה בהצטרפות לממשלה בקרב הח"כים של העבודה תגבר אחרי שההסכם יאושר על ידי ועידת המפלגה, שם על פי ההערכות הוא נהנה מרוב. הרצוג הבהיר אתמול (שבת) כי הוא מצפה מהח"כים המתנגדים לקבל את דין התנועה ברגע שההסכם יזכה לתמיכת מוסדות המפלגה. "הכרעת המוסדות הדמוקרטיים של המפלגה תחייב את כולם", אמר הרצוג אתמול.

http://www.haaretz.co.il/news/politi/.premium-1.2943531

מזהה הזדמנות נדירה 15.5

יו"ר המחנה הציוני יצחק הרצוג אמר היום (ראשון) כי הצטרפות מפלגתו לקואליציה עשויה לקדם מהלך מדיני אזורי נדיר. הרצוג לא פירט במה מדובר. במפגש בתל אביב עם עשרות פעילי חוג "מחנה רבין" במפלגת העבודה חשף הרצוג טפח נוסף מהמגעים בינו לבין ראש הממשלה בנימין נתניהו מאז כינון הממשלה.

"אני מאתר הזדמנות אזורית מדינית נדירה שאולי תחלוף ולא תחזור", אמר הרצוג. "אני לא אומר את זה בעלמא אלא בידיעה. היא מסובכת מאין כמותה, היא מורכבת. אני לא יודע אם היא תקרה, אבל יכול להיות שהיא תקרה אך ורק בגלל שינוי במבנה הממשלתי".

http://www.haaretz.co.il/news/politi/1.2944645

מכחיש דיווח בערוץ השני 16.5

ח"כ יצחק הרצוג הכחיש הערב (רביעי) את דבריו של הפרשן אמנון אברמוביץ בנוגע למשא ומתן שהתקיים לכאורה, בין המחנה הציוני לליכוד.

מוקדם יותר דיווח אברמוביץ' כי להרצוג הוצע על ידי הליכוד להצטרף לממשלה ולקבל לידיו את תפקיד שר החוץ והמשנה לראש הממשלה. על פי הדיווח, התנאי שהציבו בליכוד הוא שציפי לבני תישאר מחוץ לממשלה, "הרצוג נאלץ להשיב בשלילה להצעה מחשש לתגובתה של לבני. היא עלולה לעזוב אותנו ולחבור ליאיר לפיד", אמר.

בעקבות הדברים בערוץ 2 אמר הרצוג כי מדובר בשקר מוחלט, "האגדה שסיפר אברמוביץ' הערב על הצעה שהוצעה לי ומדוע נדחתה – בבל"ת ומוכחשת לחלוטין".

עוד הדגיש יו"ר המחנה הציוני כי "מעיתונאי רציני מצופה לבדוק את העובדות במקום לספר אגדות".

הליכוד מסר בתגובה "הדיווח של אמנון אברמוביץ בחדשות 2 אינו נכון. ראש הממשלה או מי מטעמו לא הציע ולא הבטיח להרצוג דבר".

http://www.inn.co.il/News/News.aspx/297947

 18.5 לא לליברמן

יו"ר המחנה הציוני, יצחק הרצוג, הודיע היום (רביעי) כי לא ינהל מו"מ עם נתניהו במקביל לליברמן – אך הבהיר כי הוא אינו סוגר את הדלת לכניסה לממשלה. הודעת הרצוג באה שעות בלבד לאחר מסיבת העיתונאים של יו"ר ישראל ביתנו, אביגדור ליברמן, בה הודיע כי אינו פוסל הצטרפות לממשלה. בעקבות מסיבת העיתונאים של ליברמן זימן אותו ראש הממשלה בנימין נתניהו לפגישה דחופה, היום ב-16:00.

יו"ר המחנה הציוני הוסיף כי "בגלל שעמדתי על עקרונותינו ודרכנו, זו הסיבה שעד היום אין לנו הסכם קואליציוני עם נתניהו. אם הוא רוצה להכניס את ליברמן – שיכניס, ואנחנו נפרק אותו מהאופוזיציה. כעת יותר מאי פעם הבחירה היא בין ליברמן בביטחון לבינינו בביטחון. בין טירוף לשפיות. בין מצור מדיני וכלכלי לבין שגשוג".

http://www.haaretz.co.il/news/politi/1.2947294

מסיבת עיתונאים 18.5

במסיבת עיתונאים שכינס הערב (רביעי) יו"ר האופוזיציה יצחק הרצוג, הוא תקף את חברת מפלגתו שלי יחימוביץ', וטען כי "היא התחננה לקבל תפקיד שר בממשלה", וכי "היא חתומה על מינוי של ליברמן לשר הביטחון". לאחר הכישלון במשא ומתן לכניסת המחנה הציוני לממשלת נתניהו, הוא הצהיר כי "פנינו להחלפת ממשלת ליברמן-בנט", וכי אין בכוונתו להתפטר. ".

"לא נאפשר להם יום אחד של שקט", הוסיף הרצוג. "אני אלכד את כל הכוחות והפעילים עד להחלפתם. נתניהו צריך לזכור שזה היום שבו ויתר על ההזדמנות ההיסטורית להוביל שינוי גדול בחיינו".

הרצוג פירט את רשימת ההתחייבויות של ראש הממשלה נתניהו במהלך המשא ומתן שנכשל, התחייבויות שסירב להעלות על הכתב.

תאר לי כבשה

(הערכת עריכה: הפוסט המקורי דיבר על ׳תיוג תמונות׳. יואב גולדברג תיקן שמדובר ב-captioning, כלומר תיאור תמונות או תמלול תמונות)

 מיקרוסופט שיחררו לאחרונה בוט לתיאור תמונות:

Screen Shot 2016-04-20 at 10.06.17 AM

כפי שאפשר להבין, הבוט איננו מושלם.

שאר הפוסט הוא חקירה לא ממצה של מקרי קצה בהם התוכנה טועה. יהיו שיטענו שהבוט עובד יופי, וזה רק עניין של לתת לו מספיק דוגמאות מתחומים שונים. הבוט כן אומן על אופנועים, אבל הוא לא אומן על רובוטי-רשע מהעתיד. מה אתה רוצה ממנו?

אבל אני חושב שמקרי הקצה מראים שלא מדובר רק על אימון נוסף ועוד דוגמאות, אלא שהתוכנה לא ממש מבינה מה היא רואה, לפחות לא באופן שבני-אדם מבינים.

הנה עוד כמה דוגמאות:

הרשת המלאכותית הצליחה לזהות תתי-מאפיינים חשובים בתמונה, כנראה זנב מטוס או כנפיים או פרצוף או מכנסיים, והיא יכולה לשייך את זה לפלט שבני-אדם נתנו לתמונות שמכילות תתי-מאפיינים כאלה, אבל היא לא באמת מבינה את הסכמה הסיבתית של התמונה.

עוד דוגמא:

CgQXfyDW4AAJG4E

על איזה שולחן מדובר בדיוק? כנראה שבתמונות שתוייגו בתור ״אדם״ באופן דומה אנשים ישבו על שולחן, ומכאן האסוציאציה. לא רק שהרשת לא מחברת באופן אנושי בין תתי-החלקים הויזואליים, החלק שאחראי על ״שפה״ פשוט מקשר אסוציאטיבית ואיננו מבין מה זה בכלל ״שולחן״.

יואב גולדברג צייץ עוד כמה דוגמאות:

CgQT7GVW4AAEeyo

יואב אמר שזה ״לא רע״, ובהתחלה חשבנו שאולי הרשת זיהתה את הספרים, ואת התמונות בצד הימני למעלה כאיש, ואז ניסתה לחבר ביניהם באיזשהו אופן. ניסוי וטעייה הראו שבעצם הרשת חשבה שהכסא בצד השמאלי התחתון הוא זה שנראה לרשת כמו איש.

בשלב הזה החלטתי להאכיל את התמונות עצמן בחזרה לרשת:

2016-04-18 (6).png

…ואחרי כמה זמן הגעתי ל-cap-ception:

2016-04-18 (7).png

יואב גם ניסה לתת לרשת כל מיני תמונות מלחמה:

2016-04-17 (1).png

״נפש תמימה ויפה כמו ילד״, כתב יואב. אבל הרשת לא באמת חושבת כמו ילד.

שאלתי ילד בן ארבע מה הוא רואה בתמונה.

ילד: ״לא יודע.״

אני: ״נו, תנחש.״

ילד: ״מזרקת מים.״

אני: ״לא רע. יש לך עוד ניחוש?״

ילד: ״די כבר, תגיד לי מה זה.״

אני: ״מה אתה חושב, זה מזרקת מים או כבשה?״

ילד: ״אתה מצחיק! זה לא כבשה.״

אני: ״למה לא?״

ילד: ״אין לה בכלל ראש.״

היטלר

מיקרוסופט חטפו על הראש לאחרונה אחרי שבוט אחר שהם שיחררו לטוויטר ״הפך״ להיות אנטישמי וגזען. מדובר בבוט הרבה פחות מתוחכם מתוכנת התיאור שנסקרת כאן, ולא נראה שהוא באמת ״למד״ שום דבר אלא חזר על דברים. בכל מקרה, נראה שמישהו שם למד משהו, והחליט לצנזר פנימית תגובות לתמונות מסויימות:

2016-04-18 (8)2016-04-18 (9)2016-04-18 (10)2016-04-18 (11)

כמובן שאם מישהו בכל זאת מתעקש, תמיד אפשר לייצר כותרת בסגנון ״הבוט החדש של מיקרוסופט אומר להיטלר לנסות שוב בקרוב!״

נראה שהרשת כן ״יודעת״ במה מדובר, או לפחות מזהה שמדובר במשהו שהיא לא אמורה לתייג או לענות עליו. תמונות פורנוגרפיות הן גם בקטגוריה דומה (כלומר, הרשת מזהה שמדובר במשהו שהיא לא אמורה להתייחס אליו).

אבל הרשת לא תמיד מזהה את היטלר, ואז זיהוי הרגשות שלה הוא לא רע:

2016-04-18 (14)2016-04-18 (13)2016-04-18 (12)

מחשבות סיכום

בסך הכל, הבוט החדש עובד לא רע. יחסית למצב בתחום לפני עשר שנים, למשל, נראה שמאוד התקדמנו. אבל הטעויות של הרשת הן לא טעויות שנובעות רק ממחסור בנתונים, והפתרון הוא לא רק לתת לה עוד ועוד דוגמאות.

לפי המאמר שמלווה את הפרוייקט, נראה שהתוכנה בנוייה מכמה תתי-חלקים, כולל זיהוי כוכבנים, זיהוי רגשות וזיהוי מקומות חשובים. זה נראה כמו צעד חשוב ונכון מעבר ל״זיהוי גלובלי״ שמנסה להתייחס לבעיית תיאור וזיהוי כמשפך אחד ויחיד שמקבל תמונות ויורק תיאור. אמנון שעשוע דיבר על משהו דומה לאחרונה כשהוא הבדיל בין ״הפשטה סמנטית״ (מערכת שמפרקת בעיה מורכבת לתתי-בעיות, למשל  פירוק בעיית הנהיגה הממוכנת לתתי-בעיות כמו זיהוי אנשים, זיהוי הדרך, תגובה לזיהוי אנשים וכו׳) ובין ״אימון קצה-לקצה״ (לתת לרשת בצד אחד את הפיקסלים של תמונת הכביש, בצד האחר את הזווית הנכונה של ההגה בתגובה לתמונה, ויאללה לדרך).

ולסיום, הנה מה שהבוט חושב על תמונות מימי הביניים:

2016-04-18 (16)Screen Shot 2016-04-20 at 12.13.46 PM2016-04-18 (15)