Veículos de comunicação e sites bloqueiam bot da OpenAI temendo roubo de conteúdo
The New York Times, CNN, e agências como Reuters e Bloomberg bloquearam o acesso ao GPTBot, rastreador de páginas na internet
Agência de notícias
Publicado em 30 de agosto de 2023 às 13h42.
Última atualização em 30 de agosto de 2023 às 13h43.
Vários veículos de comunicação decidiram bloquear a ferramenta de rastreamento de páginas na internet usada pela OpenAI , empresa criadora do ChatGPT , que busca melhorar seus modelos de inteligência artificial.
The New York Times, CNN, a emissora australiana ABC e as agências de notícias Reuters e Bloomberg bloquearam o acesso ao GPTBot, rastreador de páginas na internet lançado em 8 de agosto.
- Arábia Saudita oferece retomar apoio financeiro à Palestina
- PIB dos países integrantes da OCDE sobe 0,4% no 2º trimestre ante o anterior
- Financeira da Marisa recebe aporte adicional de R$ 30 milhões
- Petz lidera alta do Ibovespa com rumores sobre fusão com a Cobasi
- São Paulo terá mais de 70 shows internacionais em 2023; veja quais são os próximos
- Varejistas chineses apostam em descontos para atrair clientes no país, diante da incerteza econômica
A medida também foi adotada por veículos de comunicação franceses, como France 24, RFI, Mediapart, Radio France e TF1.
"Tem uma coisa que não vamos tolerar: o roubo não autorizado de conteúdo", disse na segunda-feira, durante coletiva de imprensa, a presidente da Radio France, Sibyle Veil.
A função do GPTBot é coletar todos os dados e informações de páginas na internet para alimentar seus modelos de inteligência artificial (IA) generativa.
Mas a start-up californiana, que tornou pública a forma de impedir que seu robô acesse os dados de um site, enfrenta uma rejeição crescente das páginas digitais.
Segundo a Originality.ai, uma ferramenta que detecta plágios, cerca de 10% da páginas mais importantes do mundo negaram o acesso ao GPTBot duas semanas depois de seu lançamento.
Entre elas estão Amazon.com, Wikihow.com, Quora.com e o banco de imagens Shutterstock. Segundo a Originality.ai, a proporção de sites na internet que proíbem o acesso ao GPTBot aumentará 5% por semana.
Remuneração e transparência
"Não há nenhuma razão para que se beneficiem dos nossos conteúdos sem contraparte", disse à AFP Laurent Frisch, diretor de estratégia digital e inovação da Radio France.
Ferramentas de IA, como o robô conversacional ChatGPT e geradores de imagens DALL-E 2, Stable Diffusion e Midjourney se tornaram muito populares no ano passado pela capacidade de gerar grande quantidade de conteúdo a partir de mensagens de texto curtas.
Mas as empresas responsáveis por estas ferramentas, como OpenAI e Stability AI, enfrentam agora uma série de processos de artistas e autores, que alegam que seu trabalho foi roubado.
"Já chega de sermos pilhados por estas empresas, que obtêm lucros às custas da nossa produção", queixou-se Vincent Fleury, diretor digital da France Medias Monde, empresa matriz da France 24 e da RFI.
Diretores de alguns meios de comunicação franceses também expressaram preocupação de que seus conteúdos sejam associados a informação falsa. Eles exigem que sejam abertas discussões com a OpenAI e outras empresas de IA.
"Os veículos devem ser remunerados de forma justa. Nosso desejo é obter acordos de licença e pagamento", declarou Bertrand Gié, diretor da divisão de notícias do jornal Le Figaro.
Primeiro passo
A agência de notícias Associated Press (AP) abriu o caminho nos Estados Unidos, ao assinar, em julho, um acordo com a OpenAI, que a autoriza a acessar seus arquivos desde 1985 em troca de ter acesso à sua tecnologia e experiência em IA.
A OpenAI também se comprometeu a destinar cinco milhões de dólares (aproximadamente 23 milhões de reais, na cotação atual) ao American Journalism Project, uma organização que apoia veículos locais, e outros US$ 5 milhões em créditos para ajudar a implantar tecnologias de IA.
Este mês, um consórcio de veículos de comunicação, entre eles AFP, Associated Press e Gannett/USA Today, publicou uma carta aberta pedindo aos dirigentes de empresas de IA que peçam permissão antes de usar seus textos e imagens para produzir conteúdo.