Não precisamos imaginar um mundo onde os deepfakes possam imitar de forma tão convincente as vozes dos políticos que possam ser usados para criar escândalos que podem influenciar as eleições. Já está aqui. Felizmente, existem inúmeras razões para optimismo sobre a capacidade da sociedade de identificar meios de comunicação falsos e manter uma compreensão partilhada dos acontecimentos actuais.
Embora tenhamos motivos para acreditar que o futuro pode ser seguro, tememos que o passado não o seja.
A história pode ser uma ferramenta poderosa para manipulação e prevaricação. A mesma IA generativa que pode falsificar eventos atuais também pode falsificar eventos passados. Embora novos conteúdos possam ser protegidos através de sistemas integrados, existe um mundo de conteúdos que não possuem marca d’água, o que é feito adicionando informações imperceptíveis a um arquivo digital para que sua procedência possa ser rastreada. Uma vez que a marca d’água na criação se torne generalizada e as pessoas se adaptem à desconfiança de conteúdo que não tenha marca d’água, então tudo o que foi produzido antes desse momento poderá ser questionado com muito mais facilidade.
E isto criará um tesouro de oportunidades para respaldar falsas alegações com documentos gerados, desde fotografias que colocam figuras históricas em situações comprometedoras, até à alteração de histórias individuais em jornais históricos, até à alteração de nomes em títulos de propriedade. Embora todas essas técnicas já tenham sido usadas antes, combatê-las é muito mais difícil quando o custo de criação de falsificações quase perfeitas foi radicalmente reduzido.
Esta previsão é baseada na história. Existem muitos exemplos de como os poderes económicos e políticos manipularam o registo histórico para os seus próprios fins. Estaline expurgou camaradas desleais da história, executando-os – e depois alterando registos fotográficos para fazer parecer que nunca existiram. A Eslovénia, ao tornar-se um país independente em 1992, “apagou” mais de 18.000 pessoas do registo de residentes – principalmente membros da minoria cigana e outras etnias não-eslovenas. Em muitos casos, o governo destruiu os seus registos físicos, levando à perda de casas, pensões e acesso a outros serviços, de acordo com um relatório de 2003 do Comissário para os Direitos Humanos do Conselho da Europa.
Documentos falsos são uma parte fundamental de muitos esforços para reescrever o registo histórico. Os infames Protocolos dos Sábios de Sião, publicados pela primeira vez num jornal russo em 1903, pretendiam ser atas de uma conspiração judaica para controlar o mundo. Desacreditados pela primeira vez em agosto de 1921, como uma falsificação plagiada de múltiplas fontes não relacionadas, os Protocolos apareceram com destaque na propaganda nazista e têm sido usados há muito tempo para justificar a violência antissemita, incluindo uma citação no Artigo 32 do Pacto fundador do Hamas em 1988.
Em 1924, a Carta de Zinoviev, considerada um comunicado secreto do chefe da Internacional Comunista em Moscovo ao Partido Comunista da Grã-Bretanha para mobilizar apoio para a normalização das relações com a União Soviética, foi publicada pelo The Daily Mail quatro dias antes de uma eleições gerais. O escândalo resultante pode ter custado a eleição aos trabalhistas. A origem da carta nunca foi provada, mas a sua autenticidade foi questionada na altura, e uma investigação oficial na década de 1990 concluiu que era muito provavelmente obra dos Russos Brancos – uma facção política conservadora liderada na altura por emigrados russos que se opunham ao regime comunista. governo.
Décadas mais tarde, a Operação Infektion — uma campanha de desinformação soviética — utilizou documentos falsos para espalhar a ideia de que os Estados Unidos tinham inventado o VIH, o vírus que causa a SIDA, como arma biológica. E em 2004, a CBS News retirou uma história controversa porque não conseguiu autenticar os documentos, que mais tarde foram desacreditados como falsificações, que puseram em causa o serviço anterior de George W. Bush, então presidente, na Guarda Aérea Nacional do Texas. À medida que se torna mais fácil gerar desinformação histórica, e à medida que o grande volume de falsificações digitais explode, surgirá a oportunidade de remodelar a história, ou pelo menos de pôr em causa a nossa compreensão actual dela.
As perspectivas de os actores políticos utilizarem a IA generativa para remodelar eficazmente a história – para não falar dos fraudadores que criam documentos legais e registos de transacções falsos – são assustadoras. Felizmente, um caminho a seguir foi traçado pelas mesmas empresas que criaram o risco.
Ao indexar uma grande parte dos meios de comunicação digitais mundiais para treinar os seus modelos, as empresas de IA criaram eficazmente sistemas e bases de dados que em breve conterão todo o conteúdo gravado digitalmente da humanidade, ou pelo menos uma aproximação significativa dele. Eles poderiam começar a trabalhar hoje para registrar versões com marca d’água desses documentos primários, que incluem arquivos de jornais e uma ampla gama de outras fontes, para que as falsificações subsequentes sejam instantaneamente detectáveis.
Esse trabalho enfrenta algumas barreiras. O esforço das bibliotecas digitais do Google para digitalizar milhões de livros de bibliotecas do mundo e torná-los facilmente acessíveis on-line atingiu os limites da propriedade intelectual, tornando o arquivo histórico impraticável para o propósito pretendido de tornar esses textos pesquisáveis por qualquer pessoa com conexão à Internet. Essas mesmas preocupações com a propriedade intelectual estão a fazer com que os criadores e as empresas se preocupem tanto com os dados de formação fornecidos à IA generativa como com as suas implicações quando utilizados para gerar conteúdo.
Dada esta história carregada, incluindo o investimento falhado da Google no seu projecto de bibliotecas digitais, quem irá intensificar e pagar por um esforço massivo semelhante que criaria versões imutáveis de dados históricos? Tanto o governo como a indústria têm fortes incentivos para fazê-lo, e muitas das preocupações de propriedade intelectual em torno do fornecimento de um arquivo online pesquisável não se aplicam à criação de versões de documentos com marca d’água e carimbo de data/hora, porque essas versões não precisam ser disponibilizadas publicamente para servir seus propósitos. propósito. Pode-se comparar um documento reivindicado com o arquivo gravado utilizando uma transformação matemática do documento conhecida como “hash”, a mesma técnica que o Fórum Global da Internet para Combater o Terrorismo utiliza para ajudar as empresas a rastrear conteúdos terroristas conhecidos.
Além de criar um bem público importante e de proteger os cidadãos dos perigos representados pela manipulação de narrativas históricas, a criação de registos verificados de documentos históricos pode ser valiosa para as grandes empresas de IA. Uma nova investigação sugere que quando os modelos de IA são treinados em dados gerados por IA, o seu desempenho degrada-se rapidamente. Assim, separar o que é realmente parte do registo histórico dos “factos” recentemente criados pode ser crítico.
Preservar o passado também significará preservar os dados de treinamento, as ferramentas associadas que operam neles e até mesmo o ambiente em que as ferramentas foram executadas. Vint Cerf, um dos primeiros pioneiros da Internet, chamou esse tipo de registro de “velino digital”, e nós precisam dele para proteger o ambiente de informações.
Esse pergaminho será uma ferramenta poderosa. Pode ajudar as empresas a construir modelos melhores, permitindo-lhes analisar quais os dados a incluir para obter o melhor conteúdo, e ajudar os reguladores a auditar preconceitos e conteúdos prejudiciais nos modelos. Os gigantes da tecnologia já estão a realizar esforços semelhantes para registar o novo conteúdo que os seus modelos estão a criar – em parte porque precisam de treinar os seus modelos em texto gerado por humanos, e os dados produzidos após a adopção de grandes modelos de linguagem podem ser contaminados com conteúdo gerado.
Chegou a hora de prolongar este esforço também no tempo, antes que a nossa política também seja severamente distorcida pela história gerada.
Jacob N. Shapiro é professor de política e assuntos internacionais na Universidade de Princeton e diretor administrativo do Empirical Studies of Conflict Project. Chris Mattmann é professor adjunto de pesquisa na Universidade do Sul da Califórnia e diretor do Grupo de Recuperação de Informação e Ciência de Dados.
O Times está comprometido em publicar uma diversidade de letras para o editor. Gostaríamos de saber o que você pensa sobre este ou qualquer um de nossos artigos. Aqui estão alguns pontas. E aqui está nosso e-mail: [email protected].
Siga a seção de opinião do New York Times sobre Facebook, Instagram, TikTok, X e Tópicos.
THE NAIS IS OFFICIAL EDITOR ON NAIS NEWS