História de Notas & Informações – Jornal Estadão

Se tudo o que amamos na civilização é um produto da inteligência, a criação de uma inteligência artificial (IA) capaz de realizar as operações mais complexas da inteligência humana em milésimos de segundo pode ser a maior invenção da história mundial. A euforia com as novas tecnologias de IA generativa são justificadas. Mas também o pavor: os humanos poderiam se tornar simplesmente obsoletos. Mas poderiam realmente?

A capacidade das novas máquinas de computar dados e sintetizá-los já supera em muito as capacidades humanas. Ainda assim, resta a questão: quem gera esses dados?

Um modo mais humilhante, mas realista, de descrever máquinas de IA é, na expressão da linguista Emily M. Bender, “papagaios estocásticos”. “Os amplos modelos de linguagem são impressionantes em sua habilidade de gerar uma linguagem realista, mas no fim das contas eles não entendem verdadeiramente o sentido da linguagem que estão processando”, diz Bender. Assim, as previsões realizadas por uma máquina que aprende sozinha estão essencialmente repetindo conteúdos dos dados. Em outras palavras, se uma máquina eficiente é alimentada com dados confiáveis, os resultados serão provavelmente confiáveis, mas, se os dados não são confiáveis, os resultados serão o inverso.

Os próprios programadores reconhecem isso. Uma pesquisa da News Media Alliance, que representa mais de 2 mil publicações, averiguou que as empresas de tecnologia utilizam “desproporcionalmente” as notícias online e conteúdos de revistas e jornais digitais para treinar seus softwares de IA. Uma análise do Washington Post revelou que as 10 principais fontes utilizadas para treinar os “modelos de linguagem grande” são veículos de mídia profissional. “Nossa própria presença (online) está dando credibilidade para essas plataformas que de outra forma seriam preenchidas por nonsense caça-cliques e informação desregulada”, resumiu Katie French, editora da Newsquest.

As empresas de tecnologia têm resistido a remunerar as fontes dessas informações com base na jurisprudência americana do “uso justo” (fair use), segundo a qual “o uso por inovadores de modos transformadores de materiais protegidos por direitos autorais não infringe esses direitos”. Pode-se questionar até que ponto isso se aplica à aprendizagem da máquina. Humanos utilizam obras protegidas por direitos autorais para aprender. Mas quando os robôs utilizam esses materiais para gerar conteúdo disponibilizado ao público e explorado comercialmente, parece inequívoco o dever de remuneração.

A prova de que as empresas de IA reconhecem isso é o acordo fechado com o grupo alemão Axel Springer pela OpenAI, que remunerará pelo uso de mídias como Bild, Politico e Business Insider.

Após meses de negociações frustradas para se fechar um acordo similar, o New York Times (NYT) se tornou a primeira grande empresa de mídia norte-americana a processar a OpenAI e a Microsoft sobre seus robôs, “por lucrar com a infração massiva de direitos autorais, a exploração comercial e a apropriação indevida da propriedade intelectual do Times”. O jornal alega que as empresas têm buscado “surfar livremente sobre o investimento massivo do Times em seu jornalismo, utilizando-o para construir produtos substitutivos sem permissão ou remuneração”. Até há pouco tempo, um internauta que quisesse, por exemplo, reproduzir a receita de macarrão com queijo do NYT teria de bancar o pagamento de uma assinatura. Hoje ele pode simplesmente pedi-la a um chatbot.

Uma opção para as mídias jornalísticas seria bloquear o acesso dos robôs aos seus websites. Isso evitará as perdas, mas não trará ganhos a ninguém. Máquinas treinadas com informação ruim, gerando conteúdos com informação ruim, só produzirão resultados ruins: mais desinformação e ameaças ao debate democrático.

Se os robôs das empresas de tecnologia geram conteúdos utilizando dados apurados por jornalistas profissionais e lucram com isso, nada mais razoável que parte desses lucros seja repassada a quem gerou esses dados. Isso, sim, será um uso justo e benéfico a todos.

Loading

By valeon