גוגל הודיעה רשמית על רכישתה של חברת reCAPTCHA, המתמחה בתחום ה-OCR (ר"ת של Optical Character Recognition או בעברית, זיהוי תווים אופטי). גוגל מתכוונת להשתמש בטכנולוגיה של החברה למספר צרכים, וביניהם, להגדלת רמת האבטחה בשירותיה המקוונים ולקידום הפרויקט הגדול שלה להמרת ספרים פיזיים לפורמט דיגיטלי.
reCAPTCHA הוקמה כמיזם אקדמאי על-ידי מדענים מאוניברסיטת קרנגי מלון שבפנסילבניה. מטרת המיזם הייתה לפתח טכנולוגיה שתאפשר לזהות מילים מדפים פיזיים שנסרקו למחשב אשר תוכנות OCR אחרות לא הצליחו לזהות. למשל, אותיות שדהו מספרים ישנים וכדומה. המדענים הצליחו להשיג זאת באמצעות פיתוח של תוכנה מיוחדת אשר אוספת את כל המילים שלא זוהו על-ידי המחשב ומציגה אותן לגורם אנושי ברשת.
על-מנת לייעל את התהליך הם שיפרו את התוכנה והפכו אותה לתוכנת אבטחה. תכונה זו היא זו שמציגה כיום באתרים רבים ברחבי האינטרנט את קודי האימות הגראפיים, אותם נאלצים גולשים להקליד כדי להירשם לשירותים שונים, על-מנת לוודא שהנרשם הוא באמת גורם אנושי ולא רובוט ספאם.
התוכנה מציגה לגולש בקובץ תמונה, שתי מילים שצולמו מדף פיזי, אשר אותן הוא נדרש לזהות. אחת שידועה כבר לתוכנה ואחת שעוד לא זוהתה. את המילים רובוט מתקשה מאוד לזהות, אך בן אנוש יכול לגלות בקלות. אם הוא מקליד נכונה את המילה הידועה, הרי שגם השנייה נכונה וכך יודעת התוכנה מה הטקסט האמיתי שעומד מאחורי המילה השנייה שבתמונה.
בתוכנה של reCAPTCHA משתמשים כיום מעל למאה אלף אתרים ברשת. גוגל מתכננת לנצל את הטכנולוגיה של reCAPTCHA לשני צרכים עיקריים, לשירותים המקוונים שלה, למשל, לצורך מניעת הפצת ספאם דרך Gmail באמצעות שימוש בקוד האימות, וגם לצורך קידום פרויקט המרת הספרים שלה, אשר יתאפשר בעקבות המידע שיתקבל מהתוכנה באמצעות הפעלתה בשירותי גוגל.