Votre visage ou votre création artistique ont-ils servi à entraîner une IA, à votre insu?

Les générateurs d’images tels que DALL-E 2, Midjourney ou Imagen ont suscité un engouement collectif depuis leur apparition cette année. Capables de générer des visuels époustouflants à partir d’un simple texte descriptif, ils sont alimentés par des milliards d’images provenant d’artistes et de portraits glanés sur le Web.

Mais cette récolte de données, utilisée à des fins d’entraînement de l’Intelligence artificielle, ne tient ni compte des droits d’auteur ou du consentement des personnes.

Aussi, un groupement d’artistes a créé un site web permettant à quiconque de vérifier si son oeuvre ou sa photo ont été utilisée pour entraîner une IA. A l’instar du site célèbre, Have I Been Pwned, permettant de découvrir si son adresse email a été piratée, Have I Been Trained, permet de savoir si une image vous appartenant a été utilisée pour entraîner une IA.

Il suffit d’entrer son nom, un texte descriptif ou de télécharger une photo dans la barre de recherche pour voir en retour les résultats correspondants. Elles sont triées à partir d’une base de données de 5,8 milliards d’images appelé LAOIN-5B. Ci-dessous, les résultats rendus d’après ma photo (je n’y figure donc pas mais je vois à qui je ressemble).

A titre de comparaison, le scandale de Cambridge Analytica en 2018 concernait l’«aspiration» des données personnelles de 87 millions d’utilisateurs.

Le média Vice raconte comment une image médicale a été retrouvée dans la base de données LAION-5B, utilisée pour entraîner Stable Diffusion et Imagen de Google.

La personne dont la photo a été retrouvée a déclaré qu’un médecin l’avait photographiée il y a près de dix ans dans le cadre d’un essai clinique, fournissant une preuve écrite de son consentement pour que l’image figure dans l’étude, mais non pour la partager. Sans savoir comment, son image s’est retrouvée dans cette base de données.

Interrogé à ce propos par Vice, un porte-parole de LAION-5B a répondu que leur organisation «travaillait activement sur un système amélioré de traitement des demandes de takedown».

Le monde artistique

Pour les artistes, une intense bataille s’annonce entre ceux qui considèrent les œuvres assistés par l’IA comme une forme de vol et ceux qui accueillent avec enthousiasme ces nouveaux outils de création.

Certains d’entre eux ont déjà commencé à soumettre leurs œuvres générées par l’IA à des plateformes de revente photos comme Shutterstock pour les monétiser. Les recherches de «AI generated» ou de «Midjourney”» produisent des milliers de résultats sur le site, selon arstechnica.

Comment les communautés artistiques pourront-elles s’adapter à un logiciel qui peut potentiellement produire un nombre illimité d’œuvres d’art magnifiques à un rythme qu’aucun humain travaillant sans les outils ne pourrait égaler.

Et pour compliquer la donne, un droit d’auteur vient d’être accordé à un artiste basé à New York, Kris Kashtanova, pour son roman graphique intitulé Zarya of the Dawn dont les images ont été générées par l’IA. Kashtanova affirme que le travail artistique assisté par l’IA n’était pas entièrement créé par elle. C’est lui qui a écrit l’histoire de la bande dessinée, créé la mise en page et fait des choix artistiques pour assembler les images.

Déterminer à qui appartient une oeuvre créée par une IA continuera à nourrir de nombreux débats.

Emily Turrettini

De nationalité américaine et suisse, Emily Turrettini publie une revue de presse sur l'actualité Internet depuis 1996 et se passionne pour les nouvelles tendances.