באחת הסצנות הזכורות מהסרט "השטן לובשת פראדה", מסתובבת עורכת המגזין היוקרתי מירנדה פריסטלי (מריל סטריפ) בין אורחי הנשף שארגנה, ומברכת אותם לשלום. מדי פעם, כאשר פלוני בלתי מזוהה מתקרב לעברה, לוחשת לה באוזנה העוזרת הכנועה המכרכרת סביבה כמה פרטים מזהים: "זה אלן, שזרק לאחרונה את אשתו לטובת רבקה מהפרלמנט" וכו'. עד שפלוני מושיט את ידו כבר נמרח חיוך על פניה של העורכת האגדית: "הו, אלן, כל כך נחמד לראות אותך שוב! מה שלום רבקה?"
האם קרוב היום שבו גברת פריסטלי לא תזדקק לעוזרת המלומדת שלה שתשנן מאות תמונות לפני הנשף? חוקרי זיהוי ממוחשב מאמינים שבעתיד הלא מאוד רחוק תוכל פריסטלי להרכיב
משקפי "גוגל גלאס" (משקפיים בעלי יכולת להציג אלמנטים של מציאות וירטואלית ה"מולבשת" על פני התצוגה הרגילה — כולל דפי אינטרנט ועוד) שמוטמעת בהם תוכנה המאפשרת לזהות אנשים ממרחק. וכך היא תעודכן בזמן אמת מי נמצא במאגר שהוזן בתוכנה מבעוד מועד. אבל כדי לעבור את המשוכה הזאת — יש לשפר את יכולות הזיהוי של המחשבים בשני אלמנטים שעדיין חסרים: זיהוי מינו של אדם (האם האיש החולף ברחוב הוא גבר או אישה?) וזיהוי גילו.
עד לפני זמן לא רב היה קושי יחסי לצייד מחשבים ביכולות זיהוי כאלה, בייחוד כאשר היה מדובר בתמונות באיכות ירודה. חוקרים מסבירים כי בעוד "זיהוי פנים" באמצעות מחשב התקדם למדי בשנים האחרונות, זיהוי ממוחשב של מין וגיל נותרו מאחור ועדיין לא הדביקו את הפער.
מחשבים כבר יודעים לזהות מין וגיל בתמונות איכות, כאלה שבהן המצולם משתף פעולה עם המצלם (למשל לצורכי מאגרים ביומטריים, או בתמונות של סלבריטיז על השטיח האדום), אבל התקשו בתמונות שצולמו ברמה וברזולוציה נמוכות.
התקצרה הדרך לזיהוי
במחקרו הטרי של ד"ר טל הסנר, חוקר הראייה הממוחשבת מהמחלקה למתמטיקה ולמדעי המחשב באוניברסיטה הפתוחה, "הערכה של גיל ומין בתמונות נטולות פילטר", שיצא לפני כמה שבועות, עבד ד"ר הסנר עם חברת הזנק ישראלית בשם "אידאנס", המתמחה בניתוח מידע ויזואלי המתקבל מטלפונים סלולריים, בניסיון לקדם את יכולות הזיהוי הממוחשבות מתוך מאגר עצום של תמונות "בלתי מפולטרות". כלומר אותן תמונות מיותרות, לכאורה, הנותרות בזיכרון של הסמארטפונים, האיי-פדים ושאר אמצעי הצילום הדיגיטליים. אלו תמונות שערכן הצילומי נמוך בשל טשטוש, העדר פוקוס, קומפוזיציה גרועה, מבט צידי של האוביקטים וכדומה.
"נכנסנו לחשבונות 'פליקר' שהיו עמוסים בתמונות 'בלתי מאורכבות' — כלומר כאלה שאינן חלק מהארכיב, אלא זבל שהמשתמש לא טרח למחוק, ואף השאיר כחלק מה'פבליק דומיין' (רשות הכלל)", מסביר ד"ר הסנר. "השאלה הראשונית שצריכה להישאל היא מדוע בכלל צריך להתעסק איתן? והתשובה שלי היא פשוטה מאוד: 'זה מה שהעיניים שלנו רואות, ואת האוביקטים האלה הן צריכות לזהות'. בדרך כלל כשננסה לזהות אנשים ברחוב, להעריך אם מדובר בזכר או נקבה, לנחש את גילו של אדם — לא נעשה זאת בתנאים אופטימליים. איש לא יעמוד מולנו וידפוק פוזה במראה מושלם עד שנזהה אותו. לרוב אנשים חולפים מולנו ביעף, בפרופיל או בתנאי ראייה גרועים וממשיכים הלאה. המטרה שלנו — לאפשר זיהוי בוודאות גבוהה — הושגה".
ד"ר הסנר אומר שזיהוי גיל ומין הוא סוגיה המטרידה את מומחי הראייה הממוחשבת כבר 30 שנה. "במחקר הזה הצלחנו להרים את הרף מבחינת דרגת הקושי של הזיהוי, והגענו למקומות שטרם הגיעו אליהם במחקרים קודמים. הצלחנו לזהות מין וגיל של מצולמים רבים ברמת ודאות גבוהה, למרות איכותם הירודה של התמונות והאוביקטים המצולמים בהן. מכאן הדרך לזיהוי פרצופים בתנאים קשים התקצרה".