מניות הטכנולוגיה ספגו מהלומה. ענקיות כמו Nvidia ומטא ניצבות בפני הררי שאלות לגבי עתידן. מנהלי היי-טק הביעו ברשתות החברתיות את חששותיהם. והכל בגלל חברת הזנק סינית אלמונית בשם DeepSeek בתחום הבינה המלאכותית. ניו-יורק טיימס מסביר מה אירע אתמול (27.1.25).
מיהי DeepSeek?
זוהי חברת הזנק אשר הוקמה וממומנת בידי חברת המסחר במניות High-Flyer שבבעלות היזם ליאנג וונפנג. מטרתה היא לבנות כלי AI בדומה ל-ChatGPT של OpenAI או Gemini של גוגל. בשנת 2021 היא רכשה מ-Nvidia כמות גדולה של שבבים החיוניים לתחום. בשנים האחרונות היא שחררה מספר מודלים גדולים, ולפני שבועיים – את יישומון ה-chatbot החינמי הראשון שלה המבוסס על מודל חדש בשם DeepSeek-V3.
מדוע השווקים הגיבו כעת?
המודל החדש דומה לזה של החברות האמריקניות, אך כעת הצוות שפיתח אותו חשף צעד גדול קדימה. אימון המודל נעשה במספר שבבי Nvidia קטן בהרבה משל חברות ה-AI המובילות: 2,000 בלבד לעומת 16,000 ויותר.
מדוע זה חשוב?
מאז החלה OpenAI את ה"בום" של ה-AI בנובמבר 2022, ההנחה הייתה שבניית הכלים החזקים ביותר מצריכה השקעה של מיליארדי דולרים בשבבים ייעודיים. המשמעות היא, שרק ענקי ההיי-טק האמריקנים – כמו מיקרוסופט, גוגל ומטא – יכולים להרשות זאת לעצמם. אבל מהנדסי DeepSeek טוענים שהוציאו 6 מיליון דולר בלבד על מחשוב גולמי – עשירית מהסכום שהשקיעה מטא בכלי האחרון שלה.
כיצד DeepSeek עשתה זאת?
מהנדסי AI מובילים בארה"ב אומרים, כי מדובר בדרכים חכמות ומרשימות. המהנדסים הסינים הציגו דרך יעילה יותר לניתוח מידע תוך שימוש בפחות שבבים. מערכות AI מובילות מבוססות על לימוד מאפיינים בכמויות מידע עצומות, כולל מלל, תמונות ושמע. DeepSeek מחלקת את ניתוח המידע בין כמה מודלים מתמחים, תוך צמצום הזמן שהולך לאיבוד בהעברת מידע ממקום למקום והפחתת כוח המחשוב הדרוש לכך.
אלו שיטות שכל אחד יכול להעתיק, מציין הטיימס. עם זאת, כעת עולה השאלה האם החברות האמריקניות הגדולות יוכלו לשמור על יתרונן ב-AI. רבים מאמינים שהטכנולוגיה בתחום תהפוך למוצר שחברות רבות יוכלו למכור.
האם הטכנולוגיה של DeepSeek טובה כמו של OpenAI וגוגל?
DeepSeek-V3 יכול לענות על שאלות, לפתור בעיות לוגיות ולכתוב תוכנות מחשב כמו מודלים קיימים. OpenAI o3 נחשפה גם היא החודש, היא נראית עוצמתית יותר מזו הסינית, אך טרם שוחררה לציבור הרחב. בשבוע שעבר נחשפה DeepSeek R1 שהרשימה גם היא את המומחים ביכולותיה הדומות לאלו של OpenAI וגרמה לפאניקה בשווקים אתמול.
מה יקרה למרכזי המידע שבונים הענקים האמריקניים?
ענקי ההיי-טק האמריקנים בונים מרכזי מידע תוך שימוש בשבבים ייעודים ל-AI וחשיבותם נותרה בעינה. מספר גדול של שבבים עדיין יכולים לעזור בביצוע יותר ניסויים לבחינת דרכים חדשות לשימוש ב-AI, תוך שמירת היתרון הטכנולוגי והתחרותי. יהיה צורך ביותר שבבים גם כדי להפעיל מודלים חדשים של "ניתוח הגיוני".
האם ארה"ב לא הגבילה את ייצוא שבבי Nvidia לסין?
כן. ממשל ביידן הטיל מגבלות כאלה במטרה לשמר את היתרון האמריקני על פני סין ומתחרות אחרות. אבל הביצועים המרשימים של DeepSeek מעלים את השאלה האם המגבלות לא היו מה שהוביל אותה לפריצת דרך זו, תוך שימוש במגוון כלים המצויים בצורה חופשית ברשת. כמה מומחים ממשיכים לתמוך במגבלות, בנימוק שהן הוטלו רק לאחרונה והשלכותיהן יורגשו בעתיד.
האם סין מובילה כעת על פני ארה"ב בתחום ה-AI?
לא. העולם טרם ראה את OpenAI’s o3, וביצועיו בניסויים מרשימים יותר מכל מה שנראה עד כה. אבל יש מומחים החוששים שסין מקדימה את ארה"ב ב-AI מקור פתוח. DeepSeek שיתפה את הקוד שלה עם עסקים וחוקרים אחרים, מה שיאפשר להם לבנות כלים משלהם תוך שימוש באותה טכנולוגיה. גישה זו צברה תאוצה ב-2023, כאשר מטא שיתפה חינם את מערכת Llama. ההערכה אז הייתה שמערכות מקור פתוח יפרחו רק אם חברות ענק כאלה יעמידו אותן לרשות הכלל. DeepSeek סתרה גם את ההנחה הזאת.
מדוע זה חשוב?
מומחים רבים טענו שהחברות האמריקניות הגדולות צריכות להימנע מפתיחת הטכנולוגיות שלהן, מחשש שישמשו להפצת מידע כוזב או לגרימת נזקים אחרים, וכמה מחוקקים אף בחנו חקיקה ברוח זו. אחרים טענו, כי גישה זו תעניק לסין את ההובלה בתחום המקור הפתוח – וכי ארה"ב תוכל לשדרג טכנולוגיות אלו. אלא שבטווח הארוך, סין עלולה ליטול מארה"ב את ההובלה בתחום ואף לבנות מערכות צבאיות מבוססות AI.