Vários veículos de comunicação decidiram bloquear a ferramenta de rastreamento de páginas na internet usada pela OpenAI, empresa criadora do ChatGPT, que busca melhorar seus modelos de inteligência artificial.
The New York Times, CNN, a emissora australiana ABC e as agências de notícias Reuters e Bloomberg bloquearam o acesso ao GPTBot, rastreador de páginas na internet lançado em 8 de agosto.
A medida também foi adotada por veículos de comunicação franceses, como France 24, RFI, Mediapart, Radio France e TF1.
“Tem uma coisa que não vamos tolerar: o roubo não autorizado de conteúdo”, disse na segunda-feira, durante coletiva de imprensa, a presidente da Radio France, Sibyle Veil.
A função do GPTBot é coletar todos os dados e informações de páginas na internet para alimentar seus modelos de inteligência artificial (IA) generativa.
Mas a start-up californiana, que tornou pública a forma de impedir que seu robô acesse os dados de um site, enfrenta uma rejeição crescente das páginas digitais.
Segundo a Originality.ai, uma ferramenta que detecta plágios, cerca de 10% da páginas mais importantes do mundo negaram o acesso ao GPTBot duas semanas depois de seu lançamento.
Entre elas estão Amazon.com, Wikihow.com, Quora.com e o banco de imagens Shutterstock. Segundo a Originality.ai, a proporção de sites na internet que proíbem o acesso ao GPTBot aumentará 5% por semana.
Remuneração e transparência
“Não há nenhuma razão para que se beneficiem dos nossos conteúdos sem contraparte”, disse à AFP Laurent Frisch, diretor de estratégia digital e inovação da Radio France.
Ferramentas de IA, como o robô conversacional ChatGPT e geradores de imagens DALL-E 2, Stable Diffusion e Midjourney se tornaram muito populares no ano passado pela capacidade de gerar grande quantidade de conteúdo a partir de mensagens de texto curtas.
Mas as empresas responsáveis por estas ferramentas, como OpenAI e Stability AI, enfrentam agora uma série de processos de artistas e autores, que alegam que seu trabalho foi roubado.
“Já chega de sermos pilhados por estas empresas, que obtêm lucros às custas da nossa produção”, queixou-se Vincent Fleury, diretor digital da France Medias Monde, empresa matriz da France 24 e da RFI.
Diretores de alguns meios de comunicação franceses também expressaram preocupação de que seus conteúdos sejam associados a informação falsa. Eles exigem que sejam abertas discussões com a OpenAI e outras empresas de IA.
“Os veículos devem ser remunerados de forma justa. Nosso desejo é obter acordos de licença e pagamento”, declarou Bertrand Gié, diretor da divisão de notícias do jornal Le Figaro.
Primeiro passo
A agência de notícias Associated Press (AP) abriu o caminho nos Estados Unidos, ao assinar, em julho, um acordo com a OpenAI, que a autoriza a acessar seus arquivos desde 1985 em troca de ter acesso à sua tecnologia e experiência em IA.
A OpenAI também se comprometeu a destinar cinco milhões de dólares (aproximadamente 23 milhões de reais, na cotação atual) ao American Journalism Project, uma organização que apoia veículos locais, e outros US$ 5 milhões em créditos para ajudar a implantar tecnologias de IA.
Este mês, um consórcio de veículos de comunicação, entre eles AFP, Associated Press e Gannett/USA Today, publicou uma carta aberta pedindo aos dirigentes de empresas de IA que peçam permissão antes de usar seus textos e imagens para produzir conteúdo.