Des artistes intentent un recours collectif contre des sociétés de génération d’images d’IA


Un marteau généré par ordinateur planant au-dessus d'un ordinateur portable.
Agrandir / Un marteau généré par ordinateur plane au-dessus d’un ordinateur portable.

Certains artistes ont commencé à mener une lutte judiciaire contre le vol présumé de des milliards d’images protégées par le droit d’auteur utilisées pour former des générateurs d’art IA à reproduire des styles uniques sans rémunérer les artistes ni demander leur consentement.

Un groupe d’artistes représenté par le cabinet d’avocats Joseph Saveri a déposé un recours collectif fédéral américain à San Francisco contre les sociétés d’art de l’IA Stability AI, Midjourney et DeviantArt pour violations présumées du Digital Millennium Copyright Act, violations du droit de publicité et concurrence illégale.

Les artistes en action—Sarah Andersen, Kelly McKernan, Karla Ortiz— “chercher à mettre fin à cette violation flagrante et énorme de leurs droits avant que leurs professions ne soient éliminées par un programme informatique entièrement alimenté par leur travail acharné”, selon le responsable texte de la plainte déposée au tribunal.

Utiliser des outils comme Stability AI Diffusion stable, À mi-parcoursou la Imaginer générateur sur DeviantArt, les gens peuvent taper des phrases pour créer des œuvres d’art similaires aux artistes vivants. Depuis l’émergence généralisée de la synthèse d’images par IA l’année dernière, les œuvres d’art générées par l’IA ont été très controversé parmi les artistes, suscitant protestations et les guerres culturelles sur les réseaux sociaux.

Une sélection d'images générées par Stable Diffusion.  La connaissance de la façon de les rendre provient d'images récupérées sur le Web.
Agrandir / Une sélection d’images générées par Stable Diffusion. La connaissance de la façon de les rendre provient d’images récupérées sur le Web.

Une absence notable de la liste des entreprises citées dans la plainte est OpenAI, créateur du DALL-E modèle de synthèse d’images qui a sans doute lancé le bal sur l’art de l’IA générative grand public en avril 2022. Contrairement à Stability AI, OpenAI n’a pas divulgué publiquement le contenu exact de son ensemble de données de formation et a sous licence commerciale certaines de ses données de formation provenant d’entreprises telles que Shutterstock.

Malgré la controverse sur Stable Diffusion, la légalité du fonctionnement des générateurs d’images d’IA n’a pas été testée devant les tribunaux, bien que le cabinet d’avocats Joseph Saveri ne soit pas étranger aux actions en justice contre l’IA générative. En novembre 2022, la même entreprise a porté plainte contre GitHub sur son outil de programmation Copilot AI pour des violations présumées du droit d’auteur.

Arguments ténus, manquements éthiques

Un assortiment de portraits de robots générés par Stable Diffusion tels que trouvés sur le moteur de recherche Lexica.
Agrandir / Un assortiment de portraits de robots générés par Stable Diffusion tels que trouvés sur le moteur de recherche Lexica.

Alex Champandard, un analyste en IA qui a plaidé pour les droits des artistes sans rejeter purement et simplement la technologie de l’IA, a critiqué le nouveau procès dans plusieurs fils de discussion sur Twitter, en train d’écrire, “Je ne fais pas confiance aux avocats qui ont déposé cette plainte, basée sur le contenu + la façon dont elle est rédigée. L’affaire pourrait faire plus de mal que de bien à cause de cela.” Pourtant, Champandard pense que le procès pourrait être préjudiciable aux prévenus potentiels : “Tout ce que les entreprises disent pour défendred eux-mêmes wsera utilisé contre eux.”

Pour Champandard, nous avons remarqué que la plainte comprend plusieurs déclarations qui déforment potentiellement le fonctionnement de la technologie de synthèse d’images AI. Par exemple, le quatrième paragraphe de la section I dit : “Lorsqu’il est utilisé pour produire des images à partir d’invites de ses utilisateurs, Stable Diffusion utilise les images d’entraînement pour produire des images apparemment nouvelles grâce à un processus logiciel mathématique. Ces “nouvelles” images sont entièrement basées sur le Les images d’entraînement et sont des œuvres dérivées des images particulières à partir desquelles Stable Diffusion s’inspire lors de l’assemblage d’une sortie donnée. En fin de compte, il s’agit simplement d’un outil de collage complexe.

Dans une autre section qui tente de décrire le fonctionnement de la synthèse d’images à diffusion latente, les plaignants comparent à tort le modèle d’IA formé avec « avoir un répertoire sur votre ordinateur contenant des milliards de fichiers d’images JPEG », affirmant qu’« un modèle de diffusion formé peut produire une copie de n’importe laquelle de ses images d’entraînement.”

Au cours du processus de formation, Stable Diffusion a puisé dans une vaste bibliothèque de millions d’images grattées. À l’aide de ces données, son réseau de neurones “a appris” statistiquement comment certains styles d’images apparaissent sans stocker des copies exactes des images qu’il a vues. Bien que dans les rares cas d’images surreprésentées dans l’ensemble de données (comme le Mona Lisa), un type de “sur-ajustement” peut se produire qui permet à Stable Diffusion de cracher une représentation fidèle de l’image originale.

En fin de compte, s’ils sont correctement formés, les modèles de diffusion latente génèrent toujours de nouvelles images et ne créent pas de collages ou ne dupliquent pas d’œuvres existantes – une réalité technique qui sape potentiellement l’argument des plaignants concernant la violation du droit d’auteur, bien que leurs arguments concernant les “œuvres dérivées” créées par l’IA générateurs d’images est une question ouverte sans précédent juridique clair à notre connaissance.

Certains des autres points de la plainte, tels que la concurrence illégale (en dupliquant le style d’un artiste et en utilisant une machine pour le reproduire) et la violation du droit de publicité (en permettant aux gens de demander des œuvres “dans le style” d’artistes existants sans autorisation) , sont moins techniques et pourraient avoir des jambes devant les tribunaux.

Malgré ses problèmes, le procès intervient après une vague de colère sur le manque de consentement des artistes qui se sentent menacés par les générateurs d’art de l’IA. Par leur admission, les entreprises technologiques à l’origine de la synthèse d’images par IA ont récupéré la propriété intellectuelle pour former leurs modèles sans le consentement des artistes. Ils sont déjà jugés par le tribunal de l’opinion publique, même s’ils finissent par être reconnus coupables de jurisprudence constante concernant la surexploitation des données publiques sur Internet.

“Les entreprises qui créent de grands modèles en s’appuyant sur des données protégées par le droit d’auteur peuvent s’en tirer si elles le font en privé”, tweeté Champandard, “mais le faire ouvertement *et* légalement est très difficile, voire impossible.”

Si la poursuite est jugée, les tribunaux devront faire la différence entre les infractions éthiques et présumées. Les plaignants espèrent prouver que les entreprises d’IA bénéficient commercialement et profitent largement de l’utilisation d’images protégées par le droit d’auteur ; ils ont demandé des dommages-intérêts substantiels et une injonction permanente pour empêcher les entreprises prétendument en infraction de commettre de nouvelles violations.

Lorsqu’il a été contacté pour commenter, le PDG de Stability AI, Emad Mostaque, a répondu que la société n’avait reçu aucune information sur le procès au moment de la publication.