A OpenAI apresentou nesta quinta-feira, 17, o ChatGPT Agent, ferramenta que marca sua entrada mais concreta na corrida pelos chamados “agentes de IA” — sistemas capazes de executar tarefas complexas no lugar do usuário. Diferente dos chatbots tradicionais, o novo agente opera um computador virtual completo, com navegador, terminal e capacidade de importar dados, tudo sob comando de linguagem natural.

O lançamento acompanha a escalada da concorrência em torno do conceito. Desde que a fintech Klarna anunciou que sua IA substituiu o trabalho de 700 atendentes humanos em fevereiro de 2024, executivos de Meta, Google e Amazon passaram a mencionar agentes de IA em quase todas as reuniões com investidores.

No caso da OpenAI, a ferramenta combina os recursos dos produtos Operator e Deep Research, já usados para navegar na web e gerar relatórios, com um novo modelo treinado especificamente para tomar decisões e manipular múltiplas ferramentas de forma coordenada.

O sistema foi treinado com aprendizado por reforço — mesma técnica usada nos modelos de raciocínio da OpenAI — e pode operar em segundo plano enquanto o usuário realiza outras atividades. A empresa admite que o tempo de resposta pode ser lento, mas afirma que “mesmo 30 minutos representam ganho relevante frente à execução humana”.

O ChatGPT Agent ainda pede permissão para ações irreversíveis, como envio de e-mails ou realização de reservas. Transações financeiras estão desabilitadas por enquanto, e há um recurso chamado Watch Mode que interrompe o agente caso o usuário troque de aba durante operações em sites sensíveis, como bancos.

O lançamento ocorre paralelamente aos esforços de empresas como Google e Amazon, que também estão investindo em agentes com maior autonomia. O Google contratou recentemente executivos da startup Windsurf para reforçar seus projetos de IA agentiva, enquanto a Anthropic, apoiada pela Amazon, lançou uma função semelhante chamada “Computer Use” no ano passado.

Ferramenta será lançada por etapas

A OpenAI informou que o ChatGPT Agent será liberado inicialmente para usuários dos planos Pro, Plus e Team, por meio do menu de ferramentas ou do comando “/agent”. Ainda não há previsão de lançamento para usuários da União Europeia ou da Suíça. O público corporativo e educacional deve receber acesso ainda neste trimestre.