O LAION-5B, um conjunto de dados usado para treinar populares ferramentas de IA, foi construído a partir da raspagem de informações da internet e contém links para fotos identificáveis de crianças, além de disponibilizar os nomes de algumas delas nas legendas ou URLs das imagens. A investigação revelou que, em muitos casos, as identidades das crianças são rastreáveis, com informações detalhadas sobre quando e onde as fotos foram tiradas.
Entre os exemplos encontrados, uma foto modificada mostrava uma menina de dois anos com sua irmã recém-nascida, com detalhes como o nome das crianças, a localização do hospital e a data do nascimento da bebê. No total, foram identificadas 170 fotos de crianças de dez estados brasileiros, e a organização ressaltou que esse número é apenas uma pequena amostra do problema, já que o LAION-5B contém bilhões de imagens e legendas.
As imagens mostram desde bebês recém-nascidos até adolescentes em diferentes situações, como comemorando o Carnaval ou soprando velas em um bolo. A pesquisadora Hye Jung Han, que liderou a investigação, decidiu analisar as plataformas de IA após descobrir que mais de 80 jovens foram vítimas de assédio sexual por terem suas fotos modificadas na deepfake por colegas de escola.
A ONG alerta para os perigos desse tipo de uso das imagens, incluindo vazamento de informações privadas e a reprodução de cópias idênticas das imagens treinadas nos modelos de IA. Além disso, a criação de clones convincentes de crianças com base em uma ou mais fotos também é uma ameaça real.
Diante dessa preocupante situação, a pesquisadora ressalta a importância de uma legislação que proteja a privacidade e os dados das crianças, além de medidas que garantam que casos de uso inadequado de imagens sejam punidos. O Conanda já publicou uma resolução sugerindo a criação de uma política nacional para proteger os direitos das crianças e adolescentes no ambiente digital, e a Human Rights Watch destaca a necessidade de cumprimento dessa resolução pelo governo.
Em resumo, a proteção das crianças no ambiente digital deve ser uma responsabilidade compartilhada entre o governo, as empresas e a sociedade. Nenhuma família, criança ou adolescente deveria ser responsabilizado por evitar o uso indevido de suas imagens e informações online, e é fundamental que sejam estabelecidas medidas eficazes para garantir a segurança e privacidade desses indivíduos.