חברת ההזנק הישראלית Baz דורגה במקום הראשון במדד הדיוק של מבחני בדיקות קוד שנכתב בסיוע
בינה מלאכותית, במסגרת מדד Code Review Bench שהושק לאחרונה. בכך הקדימה החברה מעבדות בינה מלאכותית מן המובילות בעולם, ובהן OpenAI, Anthropic, Google ו-Cursor. בנוסף דורגה החברה במקום השני במדד המשוקלל, הכולל הן את רמת הדיוק הן את היקף הכיסוי.
המדד החדש, Code Review Bench, הוא הראשון מסוגו ומתמקד באיכות בדיקת קוד שנכתב בידי מערכות בינה מלאכותית. מדדים אחרים, כגון SWE-BENCH, נועדו למדוד את יכולת המודלים לבצע משימות תכנות, אולם לטענת יוזמי המדד החדש התברר כי מודלים למדו להתאים עצמם אליהם. עד כה ערכו חברות בתחום מבחני השוואה פנימיים, אך תוצאותיהם התקבלו אם ל ספקנות. לדבריהם, זו הפעם הראשונה שבה מתבצעת השוואה אובייקטיבית בידי גוף בלתי תלוי.
Baz הוקמה בסוף 2023 בידי היזם הסדרתי גיא איזנקוט, המשמש מנכ"ל, ונמרוד קור, מנהל הטכנולוגיות הראשי. השניים שירתו יחד ביחידה 8200 ובעלי ניסיון משותף בתחום הסייבר. איזנקוט היה ממייסדי Bridgecrew, שנמכרה בשנת 2021 לחברת פאלו אלטו תמורת כ-200 מיליון דולר, ושימש לאחר מכן סמנכ"ל ניהול מוצר ואחראי על תחום אבטחת היישומים בחברה. קור היה העובד השלישי בחברה ובהמשך ניהל קבוצת פיתוח. בין המשקיעים נמנות הקרנות Battery, Boldstart, Vermillion, Secret Chord ו-Fusion.