Além da sua inteligência artificial mais conhecida, o Gemini, o Google possui uma família de grandes modelos de linguagem (LLMs) de código aberto chamada Gemma. Nesta quinta-feira, 14, a empresa anunciou o lançamento do Gemma 3 270M, um novo modelo desenvolvido para tarefas específicas com foco em eficiência.

Com 270 milhões de parâmetros – variáveis ajustáveis dentro de um modelo que são aprendidas durante o treinamento a partir dos dados –, essa versão se destaca por ser ideal para seguir instruções e estruturar textos, oferecendo uma base robusta para ajustes finos em diferentes domínios e idiomas.

O Gemma 3 270M possui arquitetura compacta e eficiente, com um vocabulário extenso de 256 mil tokens, o que significa que o modelo consegue processar e entender uma grande quantidade de unidades linguísticas distintas (os tokens). Isso possibilita o tratamento de questões raras e específicas.

Além disso, o modelo é altamente eficiente em termos energéticos. Testes internos realizados pelo Google indicaram que ele consome apenas 0,75% da bateria de um smartphone Pixel 9 Pro durante 25 interações. Assim, ele é o mais eficiente da família Gemma em consumo de energia.

Com checkpoint de quantização (QAT) disponível, o modelo pode ser executado em dispositivos com recursos limitados, mantendo alto desempenho e precisão, mesmo em suportes móveis ou ambientes com restrições de energia. Embora o Gemma 3 270M não seja projetado para conversas complexas, ele oferece excelente desempenho em tarefas que exigem execução eficiente de instruções.

Quando usar o Gemma 3 270M

De acordo com o Google, o Gemma 3 270M é perfeito para quem precisa de soluções rápidas e eficientes, especialmente em tarefas bem definidas. Ele é ideal para identificar e entender sentimentos expressos em textos, extração de dados e roteamento de consultas, além de ajudar na organização de texto não estruturado e na redação criativa.

Outro ponto positivo é a sua capacidade de rodar em dispositivos mais simples, o que reduz custos de processamento e melhora o tempo de resposta, sem precisar de servidores externos. Por ser capaz de rodar diretamente localmente, o Gemma 3 270M oferece uma camada extra de privacidade, já que os dados não precisam ser enviados para a nuvem.

Além disso, o modelo permite ajustes rápidos e experimentação, o que facilita a criação de soluções personalizadas em menos tempo. Essa combinação de especialização, custo reduzido e privacidade faz do Gemma 3 270M uma ferramenta acessível e útil para desenvolvedores que buscam eficiência e inovação.

Os modelos pré-treinados ou com ajustes de instruções, podem ser baixados em em plataformas de hospedagem de IAs de código aberto, como Hugging Face, Ollama, Kaggle, LM Studio e Docker.