Embora tenham feito avanços significativos no campo da inteligência artificial (IA), diversos analistas apontam que a OpenAI o fez à custa de “absorver” grande parte da web escrita, incluindo arquivos completos de importantes editoras como Axel Springer, Condé Nast e The Associated Press. Essa prática desencadeou tensões legais e éticas que, aparentemente, a empresa busca aliviar por meio de acordos com esses mesmos conglomerados.
ANÚNCIO
À primeira vista, é desconcertante que a OpenAI esteja firmando acordos com editoras das quais ela já obteve conteúdo sem permissão prévia. Qual é o sentido de pagar por algo que já possuem? E, mais importante ainda, por que as editoras, algumas das quais expressaram sua raiva diante do que consideram um roubo de seu trabalho, estariam dispostas a negociar?
Uma possível resposta para essas perguntas reside no panorama em constante mudança da web. O Google, que costumava ser a principal fonte de tráfego para muitos sites, tem gradualmente reduzido a quantidade de visitas que direciona para fora de sua própria plataforma. Isso coloca em risco a sobrevivência de uma grande parte da internet, e pode ser uma oportunidade que a OpenAI está tentando capitalizar.
Os acordos com as editoras
Até agora, sabemos que esses acordos permitem que a OpenAI acesse publicações com o objetivo de "enriquecer a experiência dos usuários do ChatGPT ao adicionar conteúdo recente e autorizado sobre uma ampla variedade de tópicos", conforme afirmado em um comunicado de imprensa sobre o acordo com Axel Springer. A chave aqui é o "conteúdo recente": ao raspar a web, o GPT não pode acessar informações além de uma data específica, então o acesso em tempo real poderia aproximar seus produtos de resultados em tempo real.
Os detalhes desses acordos permanecem, em sua maioria, desconhecidos, possivelmente devido a acordos de confidencialidade. Foi relatado que a OpenAI ofereceu quantias entre US$ 1 milhão e US$ 5 milhões por ano às editoras, de acordo com o The Information; no entanto, esses valores parecem insignificantes em comparação com o que a OpenAI já tomou sem permissão. Então, por que pagar?
Uma possibilidade é que esses pagamentos facilitem o acesso à API, tornando o processo de raspagem de conteúdo mais simples e atualizado. Outra interpretação é que esses pagamentos são uma forma de evitar processos judiciais que poderiam custar muito mais para a OpenAI. Já uma publicação importante, o The New York Times, entrou com uma ação acusando a OpenAI de violar direitos autorais ao utilizar seu conteúdo para treinar modelos de linguagem sem permissão.
O caso do The New York Times
O The New York Times não apenas processou a OpenAI, mas argumenta que o produto criado concorre diretamente com seu trabalho, "roubando" audiência. As negociações entre o Times e a OpenAI falharam, possivelmente porque as quantias oferecidas eram insultantemente baixas, e a empresa se baseou na defesa do "uso justo", que permite o uso não autorizado de material protegido por direitos autorais sob certas circunstâncias.
ANÚNCIO
Se o Times ganhar sua ação, poderia receber danos estatutários que começariam em US$ 750 por obra, podendo chegar a bilhões de dólares, considerando que a OpenAI usou um total de 10 milhões de obras. Isso poderia explicar por que a OpenAI está fechando acordos com outras editoras: para evitar mais ações judiciais semelhantes.
Google e o futuro da busca na web
Os acordos da OpenAI não apenas visam evitar processos judiciais, mas também melhorar a reputação da empresa. Além disso, a OpenAI lançou o SearchGPT, seu próprio mecanismo de busca que, embora ainda em fase de protótipo, pode representar uma ameaça para o Google. Este novo mecanismo poderia filtrar melhor informações confiáveis e evitar erros embaraçosos que IA frequentemente cometem.
O Google tem perdido utilidade para o usuário médio devido a mudanças em seu algoritmo que priorizam resultados de IA em detrimento de fontes originais. Isso tem enfurecido os editores, e os acordos com a OpenAI podem dar-lhes mais influência para negociar com o Google no futuro.