חברת OpenAI הציגה את המחקר על Operator, סוכן בינה מלאכותית מתקדם שיוכל לבצע משימות ברשת באופן אוטומטי. הטכנולוגיה מבוססת על Computer-Using Agent (CUA), מודל חדשני המשלב את יכולות הראייה של מודל GPT-4o עם חשיבה מתקדמת המבוססת על למידה חיזוקית.

טכנולוגיית CUA מתוכננת לעבוד עם ממשקי משתמש גרפיים (GUI), כמו כפתורים, תפריטים ושדות טקסט, בדומה לדרך שבה משתמשים בהם בני אדם.

בזכות כך, המודל מקבל יכולות נוספות לבצע משימות דיגיטליות ללא צורך בממשקי API ייעודיים למערכות הפעלה או לאתרים ספציפיים.

חדשנות בפתרון בעיות

CUA מבוסס על מחקר רב-שנים המשלב הבנה מולטי-מודלית (שילוב טקסט ותמונות) עם חשיבה מובנית. המודל מסוגל לפרק משימות מורכבות לשלבים קטנים, לתקן את עצמו במידת הצורך ולהתאים את פעולתו לאתגרים בלתי צפויים.

לפי חברת OpenAi, הוא הוכיח את יכולותיו במשימות הבאות:

  • 38.1% הצלחה במשימות שימוש במחשב (OSWorld)
  • 58.1% הצלחה במשימות רשת (WebArena)
  • 87% הצלחה במבחני WebVoyager

מתי נקבל גישה לשימוש?

בשלב הנוכחי, Operator זמין כגרסת תצוגה מוקדמת למשתמשי ChatGPT Pro בארצות הברית. המידע שייאסף יסייע לשפר את הטכנולוגיה בהמשך.

צפו בסרטון הדגמה של חברת OpenAi

בטיחות ונגישות

כדי להבטיח שימוש בטוח, OpenAI תכננה את המערכת עם דגש על אבטחה. CUA מבצע פעולות רגישות רק לאחר קבלת אישור מהמשתמש, לדוגמה בעת הזנת סיסמאות או התמודדות עם טפסי CAPTCHA.

כיצד עובד CUA?

CUA פועל בשלושה שלבים עיקריים:

  1. תפיסה: המודל סורק תמונות מסך כדי להבין את המצב הנוכחי במחשב.
  2. חשיבה: הוא מנתח את המידע ובונה צעדים לביצוע המשימה.
  3. פעולה: הוא מבצע פעולות כמו לחיצות, גלילות או הקלדה עד לסיום המשימה.

הטכנולוגיה מאפשרת למודל לפעול בסביבות דיגיטליות שונות בלי תלות בממשקים ייעודיים, ובכך פותחת דלת לשימושים רבים.

לסיכום: Operator מבית OpenAI מסמן צעד משמעותי בפיתוח סוכני בינה מלאכותית שיכולים לפעול כמו בני אדם בסביבות דיגיטליות. עם יכולת להבין ממשקי משתמש, לפרק משימות מורכבות, ולהתמודד עם אתגרים – הטכנולוגיה מציעה עתיד שבו משימות דיגיטליות מתבצעות ביעילות גבוהה ובביטחון מלא. OpenAI צועדת לקראת עידן חדש שבו אינטליגנציה מלאכותית הופכת לכלי יום-יומי יעיל ונגיש שיסייע בביצוע משימות.

אולי יעניין אותך גם :

חדשות טכנולוגיה, בינה מלאכותית, סייבר ועוד - TechZ

תפריט נגישות