גו גו אלפא-גו

מאת נביא שקר

מי שמפחד מהאבדון הצפוי לאנושות עם עלייתה של אינטיליגנציה מלאכותית, ודאי קיבל זריקת פחד מהמאמר האחרון ב-nature של קבוצת ״שכל עמוק״, בו הם מתארים אלגוריתם שהביס את אלוף אירופה במשחק העתיק גו.

האלגוריתם של החברה, אלפא-גו, הולך להתחרות נגד לי סדול בתחילת מרץ. השאלה היא על מי להמר.

שאר הפוסט מוקדש להסבר הפתיח הקצר הזה, אבל שאלת ההימור היא לא ערטילאית, אפשר להמר כאן.

גו: מדובר במשחק סיני עתיק, בו שני שחקנים שמים כל אחד בתורו אבן על לוח בצורת רשת. המטרה היא לשלוט בשטח הלוח, וללכוד את אבני היריב. יחסית לשח, מספר המצבים האפשר גדול בכמה סדרי גודל, ויש מחקרים פסיכולוגים שמראים שקידוד המצבים במוח האנושי כנראה שונה. בעוד שאלוף העולם בשח נוצח על-ידי מחשב ב-1997, טרם נוצח אלוף גו עולמי.

ב-1981 הניו-יורקר פרסמו מאמר על אינטיליגנציה מלאכותית, בעקבות תבוסת אלוף העולם בשש-בש. המאמר כלל את הקטע הבא:

This was one of the few mistakes the robot made. Backgammon is now the first board or card game with, in effect, a machine world champion. Checkers, chess, go, and the rest will follow—and probably quite soon. But what does this mean for us, for our sense of uniqueness and worth—especially as machines evolve whose output we can less and less distinguish from our own?

שש-בש נכבש ב-1979, דמקה ב-1994, שח ב-1997, ונראה שאנחנו מתקרבים כעת לגו. אני תוהה אם כותב המאמר חשב ש-35 ושנה זה ״בקרוב ממש״.

״שכל עמוק״: או יותר נכון, deep mind. מדובר בחברה לונדונית שהכריזה על עצמה כ׳תכנית אפולו לאינטיליגנציה מלאכותית׳. היא נקנתה לפני כמה שנים על-ידי גוגל. אין להם מטרה מסחרית מוצהרת מעבר לפיתוח תוכנות מעניינות. החברה שאבה עשרות דוקטורנטים במדעי המחשב ואינטיליגנציה מלאכותית, והיא כבר כבשה לפני כמה חודשים את השער של nature כשהם הצליחו לאמן אלגוריתם שמשחק משחקי אטארי שונים ברמה אנושית או על-אנושית. האלגוריתם הוא קצה-לקצה, כלומר הקלט שלו הוא הפיקסלים של המסך והפלט הוא תנועת הג׳ויסטיק. האלגוריתם משלב רשתות נוירונים ולמידת חיזוק.

אלפא-גו: כאמור, שכל עמוק כבשו שוב את השער של נייצ׳ר לפני כמה שבועות, והפעם בגלל התוכנה אלפא-גו, שהצליחה להביס את אלוף אירופה במשחק, 5-0. מדובר בהישג מרשים ביותר, ואף תוכנה לפני כן לא התקרבה לכך. אלפא-גו מורכבת משילוב של רשתות נוירונים (להערכת מצב הלוח) וחיפוש מונטה-קרלו מסויים שפותח על-ידי דיוויד סילבר והביא לפריצת דרך בגו ממוחשב לפני כמה שנים. השילוב של הערכת מצב הלוח בעזרת "זיהוי תבניות״ יחד עם חיפוש על עץ הוא רעיון ישן באופן כללי, אבל הכלים הספציפיים מהווים חידוש, ושכל עמוק בהחלט הרוויחו את התהילה שהם זוכים לה כעת.

עם זאת, אלוף אירופה בגו מדורג נמוך למדי יחסית לאלופי העולם, איפשהו במקום 600 ומשהו. האם אלפא-גו מסוגלת להביס אלוף עולם ׳אמיתי׳?

המשחק במרץ: אלפא-גו תתחרה במרץ מול לי סדול, שמדורג איפשהו במקום 1-5 בעולם כולו. בהנחה שסולם הדירוג הוא לא לינארי, בכלל לא בטוח מה רמת האימון הנוספת שנדרשת מאלפא-גו כדי להביס את לי. דיוויד סילבר עצמו אמר שהוא לא שם כסף על המשחק, אבל הוא חושב שיש להם סיכוי טוב לנצח. אני מניח שגם אם הם לא ינצחו את לי השנה, תוכנת מחשב כלשהי תנצח אלוף עולמי בשנה-שנתיים הקרובות.

ההימור: תבוסתו של אלוף עולם בגו היא עניין של זמן, אבל האם היא עניין של חודש? האתר ביט-בט התחיל להריץ הימור על תוצאות המשחק. מדובר בהימור הפופולרי ביותר באתר כרגע, וכמה עשרות אלפי דולרים מעורבים בעניין (לפי שער החליפין דולר: ביטקוין). נכון לעכשיו יש יתרון קל לאנשים שאומרים שאלפא-גו תנצח, גם מבחינת כמות האנשים וגם מבחינת כמות הכסף, אבל זה לא רחוק משיוויון.

מערכת נביא שקר החליטה גם היא להמר על המשחק, ושאלנו מקורות יודעי דבר אם יש להם ניחוש מי ינצח. בתור תגובה קיבלנו ״כן :)״

meaning

אחד מאיתנו החליט להמר על ״כן״, ואחד על ״לא״. כקולקטיב אנחנו נפסיד, ויש כאן כנראה משל לאנושות.

מודעות פרסומת