המלצות לצפייה בנטפליקס
אחרי שהטלתם על גוגל לחשב באיזה מסלול כדאי לכם לנסוע, אתם מדפדפים בחיפוש אחר סרטים חדשים בנטפליקס. לצד שמו של כל סרט מוצג בצבע ירוק מספר באחוזים שאומר לכם עד כמה הסרט הזה דומה או קרוב בסגנונו לסרטים שאתם צופים בהם בדרך כלל. לפעמים המספר הזה שגוי לגמרי, והסרט שאתם אמורים לחשוב שהוא נהדר מתגלה כאכזבה גדולה, אבל אם לשם שינוי לא תתעלמו מהאחוזים, הם עשויים לשקף את טעמכם בדייקנות רבה. ההמלצות נוצרות באופן אוטומטי לגמרי, והן ישתנו ככל שתִצפו בתוכניות מסוגים שונים. במילים אחרות, יש תוכנת מחשב אי-שם שיודעת, בלי שיהיה לה שמץ הבנה בסרטים או בסדרות, מה מתאים לטעמים שלכם ומה לא.
בנטפליקס עושים זאת כמובן על סמך מידע שיש להם על מי שמשתמשים באתר. אנשים במספרים עצומים צופים בסרטים ובסדרות בנטפליקס, והחברה מתעדת את כל הרגלי הצפייה שלהם. במילים פשוטות, פירוש הדבר שבנטפליקס יודעים באילו סוגי סרטים וסדרות אנחנו צופים, בין שאלה סרטים דוקומנטריים העוסקים באלגוריתמים לתכנון מסלולים, ובין שאלה סרטי אימה או כל סגנון אחר. בנטפליקס גם מסווגים את כל הסרטים ואת כל הסדרות שלהם לקטגוריות, ומשתמשים בשתי סדרות נתונים כדי להפיק את ההמלצות שלהם. אם אתם צופים בסרטי אימה רבים, בוודאי תרצו לצפות בעוד סרט כזה שעדיין לא צפיתם בו. נשמע די פשוט בסופו של דבר.
הקושי טמון בדברים אחרים הנעשים בנטפליקס. הם מקצים לכל הסרטים ולכל הסדרות שאינם משתייכים בבירור לקטגוריה מסוימת, כגון סרטי אימה, ניקוד שניתן באחוזים. הניקוד באחוזים מראה עד כמה הסרט מתאים לסרטים שאתם צופים בהם בדרך כלל. במילים אחרות, בנטפליקס מחליטים עד כמה סרט הרפתקאות דומה לסדרה של סרטי אימה. אם מתרחשים בו הרבה דברים מפחידים נורא, הוא יתאים בצורה טובה יותר להרגלי הצפייה שלכם מאשר סרט שאין בו הרבה התרחשויות כאלה. אלה הם פרטים מהסוג שהחברים שלכם מספרים לכם כשאתם מבקשים מהם להמליץ על משהו שכדאי לכם לצפות בו. גם נטפליקס יכולים לספק לכם את המידע הזה, אם כי ההמלצות שלהם אינן מתקרבות ברמת הדיוק שלהן לאלה של משוגע אמיתי לסרטים.
המצב מסתבך יותר במקרה שבהם אתם מעדיפים סרטי אימה רק מסוג מסוים. אם אינכם אוהבים את אלה המדממים, סרטים עתירי דם לא יתאמו לפרופיל שלכם באותה מידה כמו סרט הרפתקאות המפחיד מעט מעל הממוצע. בחינה של סרטים מקטגוריה כללית מסוימת לא תספק לכם את ההמלצות הקולעות ביותר, מאחר שהדבר החשוב באמת הוא תוכן הסרט. מאחר שמחשבים אינם יכולים להבין תוכן, ייתכן שחברת נטפליקס צריכה להעסיק צוותים רבים שמבינים תכנים. אבל מאחר שיש לה מיליוני צופים, אין היתכנות לפתרון כזה, ובחברה נאלצים להסתפק במחשבים ובאלגוריתמים להפקת ההמלצות שלהם. אפשר לעשות זאת, אבל נחוץ כאן טריק.
הרעיון עצמו פשוט למדי: המלצה נחשבת טובה אם היא דומה למה שאתם אוהבים לצפות בו. אנשים בכל העולם צופים בתוכניות של נטפליקס שהם מחבבים כי הן דומות לסדרות ולסרטים שהם צפו בהם בעבר. עבור המחשבים של נטפליקס, שני סרטים נחשבים דומים זה לזה אם אנשים רבים שראו אחד מהם צופים גם בשני. אם אלפי אנשים צופים בסרט "איירון מן 2" אחרי שצפו ב"איירון מן", הם מן הסתם דומים, ו"איירון מן 2" הוא המלצה טובה לאנשים שצפו ב"איירון מן". ככל שאנשים רבים יותר משתמשים בנטפליקס, כך החיזויים של נטפליקס ייעשו מדויקים יותר. התוכנה מציעה סדרות וסרטים שאנשים רבים מאוד כבר צפו בהם ושהם דומים או זהים בקירוב למה שאתם צפיתם בו.
אבל הפתרון הזה כרוך בבעיה. לנטפליקס יש מיליוני משתמשים, וכל אחד מהם צפה במספר גדול של סרטים ושל סדרות. הטריק שמשתמשים בו בנטפליקס כדי להציע את ההמלצות שלהם הוא חישוב מתמטי פשוט: התוכנה בודקת כמה אנשים שיש להם אותה היסטוריית צפייה — צפו גם בתוכנית שהיא רוצה להמליץ עליה. הבעיה היא בחישוב. אני מסביר אותה כאן בצורה פשוטה משום שהפרטים אינם חשופים לציבור. נטפליקס צריכים להביא בחשבון גם אנשים שראו כמעט, אבל לא בדיוק, את אותן תוכניות. ומה בדבר אנשים שאוהבים למשל לא רק סרטי אימה אלא גם סרטים תיעודיים? אם כך, יש הרבה פחות אנשים שצפו בדיוק באותן תוכניות, והעובדה הזאת עושה את ההמלצות מהימנות פחות. הרעיון הפשוט מתגלה כמסובך למדי ליישום.
זו הסיבה לכך שהצגת הסרטים והתוכניות הזמינים על מפה, כמו זו של הרכבת התחתית, עשויה לעזור בפתרון הבעיה. כל סרט או סדרה הם מעגל, כמו תחנה בעולם של נטפליקס. אפשר לנסוע מתחנה לתחנה על-ידי בחירה בשני סרטים שונים או בשתי סדרות שונות באתר של נטפליקס.
גם על המפה הזאת יש להוסיף מספרים כדי שאפשר יהיה לחשב את ההמלצות. המספרים אינם מייצגים זמני נסיעה, אלא את מספר האנשים שצפו בשתי תוכניות המחוברות בקו. אפשר לראות דוגמה פשוטה מאוד בתרשים הבא, המתאר שלושה סרטים ומספרים דמיוניים המציינים כמה אנשים צפו בהם, בצירופים שונים:
השאלה היא: איזה אחוז יקבל כל סרט, כך שיעיד עד כמה הוא מתאים להתנהגות הצפייה של כל אחד מכם? נניח שמישהו צופה בנטפליקס רק ב"איירון מן". המחשב צריך לחזות עד כמה הוא יאהב את "איירון מן 2" וגם את "הכוכב הכחול". לפי התרשים, "איירון מן 2" יקבל אחוז גבוה מאוד. הרי יש סיכוי גדול הרבה יותר שתיהנו מסרט שצפו בו אנשים רבים החולקים איתכם אותו טעם בסרטים. "הכוכב הכחול", לעומת זאת, יקבל ניקוד נמוך יותר, שכן רק מעט אנשים שצפו בו צפו גם ב"איירון מן". יתרה מזו, רק אנשים מעטים שצפו ב"איירון מן 2" (אשר המחשב סבור שהוא לטעמכם) צפו גם ב"כוכב הכחול" — סיבה נוספת להעניק לו ניקוד נמוך באחוזים.
השורה התחתונה היא שהמחשב משתמש בחיזויים שלו עצמו — לדוגמה, עד כמה תיהנו מ"איירון מן 2" — כדי לשפר את החיזויים שלו לגבי סרטים וסדרות אחרים. לא קשה לעשות זאת כשמדובר בשלושה סרטים בלבד, אבל נסו לעשות זאת עם אלפי סרטים וסדרות. הדבר אפשרי בתיאוריה; אם יש לכם זמן ומקום בכמות מספקת, אתם יכולים למצוא בעצמכם כל מסלול שתרצו לנסוע בו. אבל הודות למתמטיקה, ובעיקר בזכות הגרפים שנתבונן בהם בפרק 7, הדבר אפשרי לא רק בתיאוריה אלא גם הלכה למעשה, כמובן אם יש לכם מחשב חזק די הצורך. הגרסה המתמטית של החידה הזאת מאפשרת לנטפליקס לחזות באופן אוטומטי לחלוטין אם תיהנו מסדרה או מסרט מסוים מבלי להיעזר בצבא של משוגעים לסרטים.
מתמטיקה בכל מקום
אנחנו נתקלים במתמטיקה מדי יום ביומו, ובכל מיני מקומות. לא פשוטו כמשמעו, כמובן. אפילו אני איני צריך לחשב חישובים מתמטיים ביום רגיל, גם אם זו העבודה שלי — לחשוב על מתמטיקה. ועם זאת, מאחורי הקלעים המתמטיקה ממלאת תפקיד מרכזי בחיינו. בלעדיה לא יהיו מפות גוגל שיראו לנו את הדרך; נטפליקס יוכלו להציע לנו כמה סרטים וסדרות באקראי, שאולי תיהנו מהם, אבל הם יהיו מכֻוונים הרבה פחות לטעמכם; מנוע החיפוש של גוגל כמעט לא יוכל לעבוד. בקצרה, שירותים שאנחנו משתמשים בהם מדי יום ביומו יכולים לפעול רק משום שהם משתמשים במתמטיקה, גם אם אינכם רואים אותה.
נטפליקס, מנועי חיפוש ותוכנות לתכנון מסלולים הם דוגמאות לשירותים שתלויים באותו ענף של המתמטיקה: תורת הגרפים. אבל אין זה התחום היחיד במתמטיקה שיש לו חשיבות בחיי היום-יום. ידיעות חדשותיות רבות שקופצות לכם בטלפון מכילות סטטיסטיקה. סקרים לקראת בחירות מתיימרים להציג את ההעדפות של הבוחרים במדינה שלמה כסדרה של מספרים. אבל עד כמה הם מועילים? הם יכולים להיות רחוקים מאוד מהתוצאות, כפי שראינו בבחירות לנשיאות ארצות הברית בשנת 2016. לפי הסקרים הילרי קלינטון הייתה צפויה לנצח, וכמה מהמומחים אפילו טענו שהם בטוחים כמעט במאה אחוז בתוצאה. מִספרים יכולים להטעות בקלות, גם אם הדבר לא נעשה בכוונה תחילה. נתונים סטטיסטיים מסתירים כל מיני דברים. עבור מי שאינו מבין מה יכול להשתבש, נתון סטטיסטי שנראה חשוב הוא למעשה חסר תועלת. אומנם הסקרים אומרים לכם משהו, אבל איך תוכלו לבטוח בהם כאשר הם שוגים לעתים קרובות כל כך?
אתם מרימים לרגע את המבט מהנייד שלכם כדי להזמין אספרסו. הקפה נעשה במכונת קפה מפלדה בוהקת שמחממת את המים בדיוק לטמפרטורה הנכונה. אם המכונה היא מדגם יוקרתי, זה לא קורה סתם כך. המכונה מנטרת את מהירות ההתחממות של המים, ועל סמך המידע הזה מחליטה אם צריך לחמם אותם עוד קצת או להניח להם להצטנן, וכך הלאה. המכונה עושה זאת עד שהמים מגיעים לטמפרטורה המושלמת הדרושה להכנת הקפה. אינכם רואים את כל התהליך הזה, אבל ממש מול האף, הנוסחאות המתמטיות שהמורה שלכם דיברה עליהן בכיתה משמשות להכנת הקפה שלכם.
בזמן שאתם שותים את האספרסו, אתם קוראים את החדשות הפוליטיות בעיתון. הממשלה שינתה כמה נושאים במדיניות שלה. אתם לא בטוחים שזהו רעיון טוב, לכן אתם מעיפים מבט בתחזיות לגבי התוכניות החדשות. כתמיד, מכוני מחקר העוסקים בכלכלה ניתחו את התוכניות על כל פרטיהן. השאלה אם רעיון כלשהו הוא טוב או רע תלויה בגורמים רבים כל כך, שאתם מתקשים לעקוב אחריהם. אבל חישוב אחד מצרף את כל הגורמים האלה לפיסת מידע אחת, והיא זו שחשובה לכם: האם בסופו של דבר יהיה לכם יותר, או פחות, כסף בכיס.