Lançamento do Gemini 2.0 inaugura caminho para Google estrear sua "era dos agentes"

Nova versão traz geração de imagens e áudios nativos, além de velocidade e precisão aprimoradas

Editor de Inteligência Artificial e Tecnologia

Publicado em 11 de dezembro de 2024 às 17h40.

Última atualização em 11 de dezembro de 2024 às 17h41.

Nesta quarta-feira, 11, o Google revelou o Gemini 2.0 Flash, o modelo de inteligência artificial mais avançado já lançado pela empresa. Este marco reforça as ambições da gigante da tecnologia em liderar o desenvolvimento de agentes de IA, ferramentas projetadas para compreender, interagir e agir no mundo com supervisão humana.

O Gemini 2.0 Flash amplia as capacidades multimodais já apresentadas em versões anteriores, permitindo agora a geração nativa de imagens e áudio, além de texto.

Em testes iniciais, o modelo demonstrou avanços em velocidade, precisão e habilidades matemáticas, estabelecendo uma base sólida para o que o Google chama de “era agêntica”.

O que há de novo no Gemini 2.0 Flash?

O novo modelo representa um salto significativo em relação ao Gemini 1.5 Pro. Entre as principais melhorias, destacam-se:

Velocidade duplicada em tarefas como codificação e análise de imagens;
Maior precisão factual, com avanços em habilidades matemáticas e contextuais;
Geração e edição de imagens e áudio, incluindo narrações em oito vozes otimizadas para diferentes idiomas e sotaques;
Integração com aplicativos externos e ferramentas do Google, como Search, Lens e Maps.

Além disso, o Gemini 2.0 Flash utiliza a tecnologia SynthID para inserir marca d’água em todas as imagens e áudios gerados, garantindo que os conteúdos sintéticos sejam identificados e prevenindo abusos como deepfakes.

A partir de hoje, uma versão experimental do modelo estará disponível para desenvolvedores por meio das plataformas AI Studio e Vertex AI, mas recursos como geração de áudio e imagem serão liberados para mais usuários apenas em janeiro.

Agentes de IA

O lançamento do Gemini 2.0 Flash ocorre em um momento estratégico para o Google. A empresa tem investido em agentes de inteligência artificial, como os projetos Astra e Mariner, que buscam combinar multimodalidade com memória e capacidade de ação.

Durante uma demonstração recente no campus do Google, o Project Astra exibiu sua capacidade de interpretar imagens e interagir. No exemplo apresentado, o agente foi capaz de reconhecer e descrever obras de arte, acessar informações em tempo real e contextualizar interações passadas.

Por sua vez, o Project Mariner, projetado para operar diretamente em navegadores, realizou tarefas como adicionar ingredientes de receitas a um carrinho de compras em um site de supermercado. Apesar da lentidão do processo, a demonstração destacou o potencial de agentes que não apenas respondem, mas também executam tarefas práticas com supervisão direta do usuário.

No entanto, o Google vê o lançamento do Gemini 2.0 como uma peça fundamental para refinar essa tecnologia. Ao integrar o modelo com ferramentas como o Android Studio, Firebase e Gemini Code Assist, a empresa espera explorar novas possibilidades e atender às necessidades de desenvolvedores e consumidores.

1/7 (O MIT Computer Science and Artificial Intelligence Laboratory (CSAIL), em Cambridge, Massachusetts, desenvolveu o sistema de diagnóstico de câncer de mama baseado em IA, reduzindo erros em 15%.)
2/7 (O Google AI, com sede em Mountain View, Califórnia, criou o AlphaGo, o primeiro programa de IA a derrotar um campeão mundial de Go, revolucionando a pesquisa em aprendizado profundo.)
3/7 Localizado em Londres, Reino Unido, o DeepMind Lab é famoso pelo desenvolvimento do AlphaFold, um programa de IA que previu estruturas de proteínas com precisão sem precedentes, impactando a biologia molecular. (Localizado em Londres, Reino Unido, o DeepMind Lab é famoso pelo desenvolvimento do AlphaFold, um programa de IA que previu estruturas de proteínas com precisão sem precedentes, impactando a biologia molecular.)
4/7 (O IBM Watson Research Center, em Yorktown Heights, Nova York, desenvolveu a IA Watson, que venceu campeões humanos no programa de TV Jeopardy!, demonstrando avanços significativos em processamento de linguagem natural.)
5/7 (O Baidu Research Lab, em Pequim, China, é conhecido por seu sistema de reconhecimento de voz Deep Speech, que alcançou uma precisão de 97% na transcrição de áudio, superando as tecnologias anteriores.)
6/7 (O Berkeley Artificial Intelligence Research (BAIR) Lab, na Universidade da Califórnia, em Berkeley, criou algoritmos avançados de robótica, incluindo o Dex-Net, que melhorou a precisão da manipulação robótica em 99%.)
7/7 (O centro da Meta AI Research SuperCluster (RSC) tem um dos supercomputadores de IA mais rápidos da atualidade. Com ele, a empresa desenvolveu o sistema de tradução automática baseado em IA que suporta mais de 100 idiomas, melhorando a comunicação global em plataformas sociais da empresa.)

Acompanhe tudo sobre:Google

Austrália planeja que gigantes do setor de tecnologia a paguem por notícias

Mais de Inteligência Artificial

A indústria de chips vive um novo boom. Entenda quanto esse mercado movimenta

Mais na Exame

Imagem referente à matéria: 2 milhões de PMEs estão mais expostas à transição da Reforma Tributária, diz estudo

Economia

Inteligência Artificial

Lançamento do Gemini 2.0 inaugura caminho para Google estrear sua "era dos agentes"

Nova versão traz geração de imagens e áudios nativos, além de velocidade e precisão aprimoradas

O que há de novo no Gemini 2.0 Flash?

Mais de Inteligência Artificial

A indústria de chips vive um novo boom. Entenda quanto esse mercado movimenta

ChatGPT apaga fronteiras entre empregos em 43,5% das tarefas

O que o fracasso da IA no Starbucks revela sobre a adoção em larga escala e o que aprender com isso

Claude ultrapassa Starbucks e McDonald's em receita

Mais na Exame

2 milhões de PMEs estão mais expostas à transição da Reforma Tributária, diz estudo

Filosofia, semiótica e neurociência: a aposta da Saint Paul para formar CEOs

Patriots, diplomacia e Rússia: os acordos de Trump e Zelensky na Casa Branca

A indústria de chips vive um novo boom. Entenda quanto esse mercado movimenta