Investing.com -- OpenAI ha presentato oggi un nuovo strumento di intelligenza artificiale (AI) chiamato Operator, progettato per eseguire compiti sul web in modo autonomo. Questo strumento utilizza un proprio browser per interagire con le pagine web attraverso la digitazione, il clic e lo scorrimento. Come anteprima di ricerca, Operator ha alcune limitazioni ma si evolverà in base al feedback degli utenti.
Operator può gestire una varietà di attività ripetitive del browser, tra cui la compilazione di moduli, l'ordinazione di generi alimentari e la creazione di meme. Questo strumento amplia la funzionalità dell'AI utilizzando le stesse interfacce e gli stessi strumenti con cui gli esseri umani interagiscono quotidianamente, facendo risparmiare tempo alle persone su compiti di routine e offrendo nuove opportunità alle aziende.
Per un lancio sicuro e iterativo, Operator è inizialmente disponibile per gli utenti Pro negli Stati Uniti su operator.chatgpt.com. Questa prima versione aiuterà a raccogliere feedback dagli utenti e dall'ecosistema più ampio, consentendo miglioramenti nel tempo. Il piano è di estendere eventualmente l'accesso agli utenti Plus, Team ed Enterprise e integrare queste funzionalità in ChatGPT in futuro.
Operator è alimentato da un nuovo modello chiamato Computer-Using Agent (CUA), che combina le capacità di visione di GPT-4o con un ragionamento avanzato attraverso l'apprendimento per rinforzo. CUA è progettato per interagire con interfacce grafiche utente (GUI) come pulsanti, menu e campi di testo. Operator può vedere e interagire con un browser, permettendogli di agire sul web senza richiedere integrazioni API personalizzate.
In caso di sfide o errori, Operator può utilizzare le sue capacità di ragionamento per autocorreggersi. Se incontra un compito che non può completare, restituisce il controllo all'utente, garantendo un'esperienza fluida e collaborativa.
Nonostante sia nelle sue fasi iniziali, CUA ha raggiunto nuovi risultati di riferimento in WebArena e WebVoyager, due importanti benchmark di utilizzo del browser.
Per utilizzare Operator, gli utenti devono semplicemente descrivere il compito che vorrebbero eseguire. Gli utenti possono assumere il controllo del browser remoto in qualsiasi momento, e Operator è progettato per chiedere all'utente di prendere il controllo per compiti che richiedono login, dettagli di pagamento o quando si risolvono i CAPTCHA.
Gli utenti possono personalizzare i loro flussi di lavoro in Operator aggiungendo istruzioni personalizzate per tutti i siti o per siti specifici. Operator permette anche agli utenti di salvare prompt per un accesso rapido sulla homepage, ideale per compiti ripetuti. Gli utenti possono far eseguire a Operator più compiti contemporaneamente creando nuove conversazioni.
Operator trasforma l'AI da strumento passivo a partecipante attivo nell'ecosistema digitale. Mira a semplificare i compiti per gli utenti e offrire vantaggi alle aziende che cercano esperienze innovative per i clienti e tassi di conversione più elevati. Sono in corso collaborazioni con aziende come DoorDash (NASDAQ:DASH), Instacart (NASDAQ:CART), OpenTable, Priceline, StubHub, Thumbtack, Uber (NYSE:UBER) e altre per garantire che Operator affronti le esigenze del mondo reale rispettando le norme stabilite. Si stanno anche compiendo sforzi per migliorare l'accessibilità e l'efficienza di certi flussi di lavoro, in particolare nelle applicazioni del settore pubblico, lavorando con organizzazioni come la City of Stockton per semplificare l'iscrizione ai servizi e ai programmi della città.
Questo articolo è stato generato e tradotto con il supporto dell'intelligenza artificiale e revisionato da un redattore. Per ulteriori informazioni, consultare i nostri T&C.