Hoje não existe consenso na literatura acadêmica ou em patentes sobre quem está mais próximo de construir uma inteligência artificial geral (AGI). Ainda assim, quando se analisam os principais papers recentes, benchmarks técnicos e relatórios de frontier labs, um pequeno grupo aparece consistentemente na dianteira da corrida: Google DeepMind, OpenAI, Anthropic e xAI. Entre eles, muitos analistas apontam uma ligeira vantagem recente do Google DeepMind, especialmente em métricas de raciocínio abstrato como o benchmark ARC-AGI.

Parte da dificuldade em medir o progresso rumo à AGI vem do próprio conceito. Pesquisadores vêm argumentando que não é possível avaliar "inteligência geral" usando apenas um único teste ou um indicador médio para perseguir. Trabalhos recentes propõem frameworks multidimensionais, método que avalia capacidades como raciocínio causal, generalização, teoria da mente, planejamento e consistência entre tarefas. Esses modelos de avaliação também penalizam sistemas que apresentam desempenho extraordinário em alguns domínios, mas fracassam em outros — o que ajuda a evitar que especialistas muito eficientes sejam confundidos com sistemas realmente gerais.

Nesse contexto, o ARC-AGI, derivado do ARC Prize, tornou-se um dos principais indicadores de progresso em raciocínio geral. O teste foi criado justamente para medir a capacidade de abstração e generalização em tarefas que os modelos não viram durante o treinamento. Relatórios técnicos de 2025 indicam que o Gemini 3 Pro com o modo "Deep Think", do Google DeepMind, alcançou cerca de 45% no ARC-AGI, superando temporariamente modelos como o3/GPT-5.1 da OpenAI, Claude 4.5 da Anthropic e Grok 4 da xAI. O resultado levou diversos analistas a apontar o DeepMind como líder momentâneo em raciocínio abstrato.

Empresa O que está fazendo Como isso se conecta a AGI Google DeepMind Gemini 3 Deep Think com ~45% no ARC‑AGI, forte integração com AlphaFold 3 e robótica, foco explícito em “general‑purpose agents”. Indica liderança em raciocínio abstrato e aplicação em múltiplos domínios (ciência, robôs), o que muitos veem como o caminho mais “AGI‑like”. OpenAI Linha GPT‑4 → GPT‑5.1/o3, foco em escalonamento, agentes e segurança; avaliada nos mesmos benchmarks ARC‑AGI e em taxonomias cognitivas. Muito forte em linguagem, multimodalidade e ferramentas; vista como co‑líder, mesmo sem dominar todos os benchmarks ao mesmo tempo. Anthropic Modelos Claude 3.x/4.5, forte ênfase em interpretabilidade, alinhamento e transparência; liderança em índices de segurança. Em capacidade bruta compete com OpenAI/DeepMind, mas é mais citada como líder em “AGI segura” do que em “AGI mais poderosa”. xAI (Musk) Grok 4 aparece nos mesmos comparativos de raciocínio; parte do pelotão de frontier labs que reportam ARC‑AGI publicamente. Corre mais pelo lado de velocidade de iteração e integração com produtos X/Tesla, mas com menos transparência técnica.

Mesmo assim, a liderança não é clara quando se observa o ecossistema de forma mais ampla. O Google DeepMind tem investido fortemente na ideia de agentes generalistas capazes de atuar em múltiplos domínios, combinando modelos de linguagem com projetos científicos como AlphaFold 3 e iniciativas em robótica. A OpenAI, por sua vez, mantém vantagem em escala de modelos, multimodalidade e integração com ferramentas, o que muitos pesquisadores consideram essencial para sistemas mais próximos de uma inteligência geral. Já a Anthropic aparece frequentemente como líder em segurança, interpretabilidade e alinhamento, dimensões vistas por parte da comunidade como indispensáveis para uma eventual AGI segura.

A xAI, fundada por Elon Musk, também aparece nos comparativos de frontier labs, principalmente com o modelo mais recente do Grok. A empresa avança com velocidade de iteração elevada e aposta na integração direta com produtos como X e Tesla, embora publique menos detalhes técnicos que alguns concorrentes.

As patentes registradas recentemente reforçam essa direção, mas raramente utilizam explicitamente o termo "AGI". Em vez disso, descrevem arquiteturas de agentes multimodais, sistemas de orquestração de múltiplos modelos, agentes autônomos em ambientes tridimensionais e sistemas capazes de perceber e agir continuamente no mundo físico. Muitos desses registros apontam para a ideia de agentes situados, capazes de interpretar o ambiente em tempo real e tomar decisões — uma visão frequentemente associada ao conceito de "AGI encarnada", em outras palavras, robôs humanoides.