מה שנקרא לו שושנה ריחו יהיה מתוק, אבל פופולרית היא לא תהיה
מאת נביא שקר
הלמ״ס פרסמו את 50 השמות הנפוצים ביותר בישראל בין השנים 1948-2007. ווינט פרסמו 2 כתבות בנושא (בנים ובנות), עם כמה גרפים לא נעימים במיוחד שמראים את הפופולריות של שמות ספציפיים.
חשבתי לעשות כמה גרפים זריזים.
הנה למשל האורך הממוצע של השמות הפופולריים לאורך השנים (באדום):
נראה שהייתה נטייה לקצר שמות בין השנים 1970-2000 בערך אצל בנות. אצל בנים הסיפור יותר מסובך, ובכל מקרה השונות (בכחול) מראה שזה אפקט קטן למדי גם אם הוא קיים.
הנה דרך אחרת להסתכל על אותו דבר, הגרף הבא מציג את האחוז היחסי של שמות באורך שונה (מ-2 אותיות ומעלה).
למשל, אפשר לראות שהייתה עלייה בשמות באורך 5 אצל בנות עד שנת 1970, ואז יש עלייה בשמות באורך 4 על חשבון שמות באורך 5 ומעלה. שמות באורך 6 ומעלה כמעט נמחקים אצל הבנות בשנות ה-80 ובכל מקרה מעולם לא היו פופולריים. שימו לב גם לעלייה ודעיכה של שמות באורך 2 אצל בנים ובנות.
אפשר גם לבדוק סיומות פופולריות. הנה למשל כמות השמות הפופולריים שנגמרים ב-ה׳ לעומת אלה שנגמרים ב-ת׳, עבור בנות:
וכמובן שאפשר לעשות זאת עבור התחלות (״א״ זה דומיננטי עד שנות ה-80 בערך, ואז יש עלייה של כל מיני דברים אחרים). אפשר לעשות את אותו דבר גם עבור ״פרגמנטים״ – דברים בהתחלת, אמצע או סוף המילה. למשל, ״לי״ נהיה עניין פופולרי בשנות ה-70 ומאז זה נשאר.
חוץ מזה, אפשר לשאול – כמה שמות שונים הופיעו ברשימה לאורך השנים? תיאורטית המספר הזה נע בין 50-3000, אבל בפועל מדובר ב-135 לבנים, ו-187 לבנות:
אנחנו לא מחדשים יותר מדי.
מה שבאמת מעניין אותי זה הגיוון המשתנה של שמות, אבל את זה אי אפשר להבין מהמידע של הלמ״ס. באנגלית למשל יש מידע לא רק מהם השמות הפופולריים ביותר בכל שנה (הרבה יותר מ-50), אלא גם מה הנפח היחסי של השמות באוכלוסיה. כך אפשר לראות ש-20 השמות הפופולריים ביותר של הבנים לפני עשרות שנים תפסו נפח אדיר של האוכלוסיה, בעוד 20 השמות הפופולריים ביותר של הבנים כיום תופסים נפח הרבה יותר קטן. זה מראה שיש תהליך של גיוון בשמות לאורך השנים.
זה ממצא ידוע, לא אני עליתי עליו, אבל הייתי שמח לבדוק אותו גם בעברית, ואי אפשר.
ייתכן ואפשר אבל כמו שאני מכיר את ההלמס, כנראה שעבור בסיס נתונים מורחב תצטרך לשלם (כי מאגרי המידע של ההלמס לא שייכים לציבור למרות שמדובר על גוף ממשלתי שמקבל משכורת מהמיסים שלנו)
מאוד ייתכן. איכשהו התחושה שלי היא שאם רק מפרסמים את האחוז היחסי מאז 2010 (כאן http://www.cbs.gov.il/reader/cw_usr_view_SHTML?ID=825) זה כי אין להם אותו מהשנים שלפני זה.
מעולה.
הנה הגרף שתמיד רציתי לראות בעצמי:
http://imgur.com/9r2JLli
אני מניח שזה מבוסס על נתוני הלמ׳ס כאן?
http://www.cbs.gov.il/reader/cw_usr_view_SHTML?ID=825
לצערי זה רק מ-2010 והלאה.
בדיוק כך.
תגובה שאינה קשורה לפוסט זה:
בתור מישהי שכותבת את התזה שלה כרגע ונדהמת כל פעם מחדש מהאפקט שיש לניסוח על תפיסת המחקר עצמו, הייתי מאוד שמחה אם למשל היית סוקר את התפלגות הפעלים, שמות התואר וכו' במאמרים מדעיים (ממגזינים עם אימפקט פקטור גבוה, כמובן), ואולי אפילו מקרלץ את ההתפלגות הזו עם מס' ציטוטים ביחס לזמן הפרסום (או איזשהו נרמול הגיוני יותר).
ובאופן כללי – מאוד כיף לקרוא את בלוגך! הוא אי של חשיבה סטטיסטית ורציונלית בים של conformation biases.
זה לא בדיוק עונה על הקריטריונים שלך, אבל אנשים הפעילו למשל topic models בניסיון לחפש אילו נושאים נמצאים ״באופנה״ בתת-ז׳אנרים של ספרות מדעית לאורך השנים. הנה למשל מאמר של טום גריפיתס בנושא:
יש ללחוץ כדי לגשת אל sciencetopics.pdf
עשו עוד לא מעט כאלה.
ותודה על המילים המעודדות.
בואו ננסה לארגן שביתה – עד שהלמ"ס לא מפרסם יותר נתונים על שמות- לא נותנים שמות לילדים…
לדעתי זה ראוי!
לגמרי ראוי.
רגע…ראוי…ראוי זה שם *נהדר* לתינוק!
נחמד מאד.
כידוע, רנדל מונרו בדיוק השבוע פרסם המלצה נלהבת[1] ומוצדקת על בלוג ושמו The Baby Name Wizard[2]. שווה מבט.
[1] http://blog.xkcd.com/2014/01/31/the-baby-name-wizard/
[2] http://www.babynamewizard.com/blog
האמת שלא ראיתי את ההמלצה, תודה על ההפנייה. לפני כמה שבועות קראתי פוסט די מוצלח בנושא שמות לתינוקות:
http://www.waitbutwhy.com/2013/12/how-to-name-baby.html
בקריאה חוזרת מתברר שהוא בעצמו מצטט את האתר שרנדל ואת (אתה) הפנת אליו. נחמד.