Nem toda empresa consegue se jogar no mercado de IA generativa com uma nova ferramenta. Enquanto Microsoft e Google correm com seus próprios produtos e aprofundam parcerias, players menores do mercado de redes sociais tentam conseguir alguma fatia com possivelmente a única carta que eles têm na manga: dados de usuários.

Ambas pertencentes a americana Automattic, a rede social Tumblr e o publicador WordPress estariam prestes a fechar acordos com as empresas de IA generativa OpenAI e MidJourney para ajudar no treinamento de modelos de linguagem.

Já o Reddit, que acaba de registrar pedido de IPO, está negociando um contrato de US$ 60 milhões com o Google para alimentar ferramentas como o Gemini enquanto busca "novas formas de gerar receita".

As informações não foram confirmadas pelas empresas, mas foram divulgadas pelos portais 404 Media e Reuters, que conversaram com fontes internas das companhias.

Por que agora?

É importante entender o contexto no qual essas parcerias surgem.

Empresas que desenvolvem ferramentas de IA têm buscado companhias de mídia para treinar e diversificar os modelos de linguagem, mas também para escapar de um eventual processo por direitos autorais.

O jornal americano New York Times, por exemplo, está processando a OpenAI e a Microsoft por treinar seus modelos ChatGPT e Copilot através da "cópia e uso de milhões" de seus artigos.

A OpenAI também já fechou contrato com a Shutterstock, por exemplo, uma provedora de bancos de imagens e vídeos, provavelmente para treinar ferramentas como a Sora.