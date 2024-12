LAS VEGAS – O braço de nuvem da Amazon, a Amazon Web Services (AWS), anunciou nesta terça-feira, 3, uma linha de novos modelos multimodais de IA generativa, cada um com capacidades distintas para atender diferentes necessidades empresariais, chamada Amazon Nova.

Há quatro modelos focados em texto: Micro, Lite, Pro e Premier. Segundo executivo da Amazon, a criação deles contribuirá para a "renovação" da Alexa. Uma versão mais inteligente da assistente é algo que já é bastante discutido, mas nada do tipo foi anunciado pela gigante do e-commerce até o momento.

Há também um modelo de geração de imagens, Nova Canvas, e um modelo de geração de vídeo, Nova Reel. Eles são semelhantes aos modelos da competição, mas mantém o "diferencial AWS": foco na segurança, moderação de conteúdo para evitar alucinações e, claro, o B2B.

Todos já estão disponíveis globalmente para clientes da AWS no Amazon BedRock, plataforma para aplicações de inteligência artificial. "Os clientes podem facilmente experimentar e avaliar os modelos para determinar qual será o melhor para aquela aplicação", resume a companhia em nota.

O anúncio foi feito durante o AWS re:Invent, evento da companhia realizado anualmente em Las Vegas, nos Estados Unidos. A convenção, que reúne desenvolvedores, clientes e parceiros, vai até o dia 6 de dezembro e concentra as principais novidades da marca.

Sphere, em Las Vegas: nova atração turística da cidade chama atenção durante o AWS re:Invent (Amazon)

O que o Amazon Nova oferece?

O Amazon Nova inclui três novos modelos de texto: Nova Micro, Nova Lite e Nova Pro. Cada um se diferencia do outro por tamanho e capacidade de processamento.

O Nova Micro é o modelo mais rápido, com latência extremamente baixa, ideal para aplicações que exigem respostas rápidas em textos.

Só o Micro trabalha somente com texto. Todos os outros são versões que podem processar imagens, vídeos e textos com alta eficiência.

Segundo Andy Jassy, CEO da Amazon, é o Nova Pro que oferece o melhor equilíbrio entre precisão, velocidade e custo.

Ano que vem, a empresa promete o lançamento do Nova Premier, que deve ser um modelo mais robusto, projetado para tarefas complexas de raciocínio e para criação de modelos personalizados.

Mais opções para criar

Além dos modelos voltados para geração de texto, a Amazon também apresentou duas inovações significativas no campo da criação de mídia com o Nova Canvas e o Nova Reel.

O Nova Canvas é um modelo de geração de imagens, permitindo que os usuários criem imagens de qualidade profissional a partir de descrições textuais ou imagens fornecidas como entrada.

O modelo inclui controles de layout, paleta de cores e moderação de conteúdo, garantindo que as imagens geradas sejam "adequadas e responsáveis".

A ênfase em criação de conteúdo responsável é, muito provavelmente, devido aos casos de "alucinação". Quando o Google lançou o próprio modelo de geração de imagens, teve que voltar atrás após usuários criarem imagens de homens negros vestidos com a roupa da Juventude Hitlerista.

Campus da Amazon, em Seattle: a AWS, braço de nuvem da gigante, acaba de anunciar uma nova família de IA multimodal

Já o Nova Reel promete gerar vídeos de alta qualidade a partir de prompts textuais e visuais, com a capacidade de ajustar movimento de câmera, incluindo zoom, rotação em 360 graus e panorâmicas.

Tanto o Google quanto a OpenAI já tem as próprias versões de geração de vídeos. Atualmente, o Nova Reel gera vídeos de até seis segundos, mas a Amazon já anunciou que, em breve, será possível gerar vídeos de até dois minutos.

Ambos os modelos criativos também vêm com controles internos de responsabilidade, como marcação d'água e moderação de conteúdo, para evitar a geração de material prejudicial ou não autorizado.

O futuro é "any-to-any"

Sem pressa nenhuma, a Amazon planeja lançar um modelo de fala para fala no primeiro semestre de 2025. No Gemini, do Google, e no ChatGPT, por exemplo, já é possível conversar com a IA generativa.

Além disso, a Amazon está desenvolvendo um modelo multimodal para multimodal (chamado de "any-to-any"), que permitirá a entrada e saída de dados em várias formas, como texto, imagem, vídeo e áudio.

*A jornalista viajou a convite da Amazon Web Services (AWS)