Une série d'artistes français et européens inclus
En s’appuyant sur les travaux de Reid Southen et Gary Marcus, Next montre que la dernière version de Midjourney produit des images de films, des logos ou des reproductions d’œuvres soumises aux droits d’auteur.
L’histoire peut être racontée de plusieurs manières.
Une version très courte serait de dire : ce matin, chez Next, nous avons demandé au moteur d’intelligence artificielle générative Midjourney de générer une image de « jouets animés » et la machine nous a proposé, toute seule, Wall-E d’une part, Woody et Buzz l’Éclair de Toy Story d’autre part, trois personnages dont les droits appartiennent aux studios Pixar et à Disney, sans que ceux-ci soient cités.

Génération d’une image de “jouet animé” sur Midjourney, par Next.

Génération d’une image de “jouet animé” sur Midjourney, par Next.
Elle nous a aussi très bien réussi cette image de canette siglée.

Image d’une canette siglée de la marque Coca-Cola générée sur Midjourney par Next.
Et maintenant la version longue…
Du point de vue d’une certaine bulle Internet artistique et francophone, on peut la faire commencer dans la nuit du 1er au 2 janvier. Sur Bluesky, l’auteur américain Phil Foglio envoie un message à diverses communautés artistiques : celles des auteurs de webcomics, celle des auteurs de science-fiction, directement à l’éditeur Wizards, qui édite le jeu Magic: the gathering.
Chaque fois, il écrit la même chose : « Les enfants ! Voici un jeu marrant ! On vient de publier une liste de tous les artistes que Midjourney admet avoir récupérés pour former son moteur d’I.A.. Est-ce que vous êtes sur la liste ? (Nous, oui). Est-ce que vous avez un bon avocat ? (Nous, oui). »
La liste en question ? Un PDF intitulé « Exhibit J (Midjourney Name list) », en réalité disponible depuis plusieurs semaines : il fait partie des éléments versés au dossier de la plainte qui oppose l’artiste américaine Sarah Andersen et plusieurs de ses collègues aux éditeurs de modèles d’intelligence artificielle Stable Diffusion (Stability AI) et Midjourney (Midjourney). Et contient les noms de quelque 4 700 artistes dont Midjourney affirme pouvoir reproduire ou chercher, à terme, à permettre de reproduire le style.
Constituée par les propres équipes de Midjourney, la liste a d’abord été partagée sous la forme d’un document Google, dont l’accès est longtemps resté public. Sur X (anciennement Twitter), des internautes partagent des captures de la conversation qui a mené au partage, par le CEO de Midjourney David Holz, du Google Sheets en question.

Si l’accès au document d’origine est désormais fermé, celui-ci a été enregistré sur Internet Archive. Et sous la forme d’un PDF, donc, constitué lorsque le collectif d’artistes qui a porté plainte contre Stability AI et Midjourney s’est agrandi et a complété sa plainte, en octobre dernier.
Des street artists et des dessinateurs francophones parmi les inspirations de Midjourney
En fouillant dans ce document, les internautes ont repéré plusieurs noms d’artistes francophones, dont celui du dessinateur Boulet, prévenu tant de fois qu’il en a été réduit à demander aux gens de cesser de l’alerter… tout en précisant qu’il considérait les constructeurs de modèles d’IA générative comme des « parasites sans âmes ».

Next l’a contacté, ainsi que plusieurs autres artistes francophones présents dans la liste. Deux street artists ont répondu à l’heure de publier ces lignes : ni C215, ni Jef Aerosol n’avaient conscience d’être cités parmi les inspirations de Midjourney avant que nous ne les alertions. Propriétaire des droits sur l’œuvre d’Hergé, la société Tintinimaginatio n’a pas souhaité commenter.

Résultat de tests menés par Next pour générer des images dans le style de Tintin ou des Schtroumpfs.
S’il n’est pas certain que le travail de chaque nom présent dans la liste de Midjourney n’ait directement été utilisé dans l’entraînement du modèle – c’est exactement ce que les plaignants américains devront tenter de prouver avec leurs propres productions face à la justice de leur pays, notamment par rétro-ingénierie –, ce manque d’information n’est pas non plus étonnant.
Auprès de Forbes, en septembre 2022, David Holz avait clairement admis avoir construit le jeu d’entraînement du modèle en récupérant des images partout sur internet. Il avait par ailleurs précisé n’avoir pas cherché à obtenir le consentement de leurs auteurs, car « il n’exist[ait] pas vraiment de manière de récupérer des centaines de millions d’images et de savoir d’où elles viennent. »
- Getty poursuit un éditeur d’algorithme en justice pour violation des droits d’auteurs
- Pas de copyright pour les images générées par l’IA
Des violations des droits d’auteurs toujours plus flagrantes


Collage de signatures générées par Midjourney au fil des expérimentations de Next.
Quand l’illustrateur et concept artiste Reid Southen, qui a travaillé sur des films comme Matrix Resurrections, The Hunger Games ou Alien, et pour des studios comme Marvel, Warners Bros ou Paramount, l’apprend, il réalise ses propres tests. Et les montre publiquement sur X (Twitter), une décision qui lui vaut de se faire exclure de son compte Midjourney, quand bien même il en est utilisateur payant, et de voir l’historique de ses productions effacé. L’affaire attire l’attention du spécialiste de l’intelligence artificielle Gary Marcus, qui considèrent les tests de Reid Southen comme une expérience de red teaming (techniquement, une bonne pratique de sécurité qui consiste à tester son modèle avant de le rendre public. En pratique, potentiellement problématique pour une entité privée quand c’est un agent externe qui s’y adonne.) Dans sa newsletter, l’expert s’étonne de la réaction de Midjourney. Il considère qu'elle démontre sa « culpabilité ». Il cite, aussi, un ancien employé de Stable AI, Ed Newton-Rex. En ligne, ce dernier encourage les utilisateurs à ne pas se concentrer sur le seul Midjourney, mais bien à vérifier les pratiques de violation des droits d’auteurs de tous les modèles génératifs disponibles. « Outre tous les exemples de Midjourney v6 générant des images qui sont de claires répliques de films célèbres, il est important de se rappeler que de nombreux modèles d’IA générative reproduisent des travaux sous droits d’auteurs sans que cela soit aussi évident - ils copient les œuvres pendant l'entraînement, et mettent en place des astuces simples pour essayer d'empêcher les utilisateurs de voir des copies évidentes », écrit-il. Avec les modèles d'IA générative, explique l'avocat en droit du numérique Matthieu Quiniou, le risque en termes de violation de droits d'auteur se situe en deux points : « en entrée, lors de l'entraînement », lorsque le constructeur utilise des œuvres a priori protégées pour construire sa machine. « Dans les modèles à diffusion latente comme Stable Diffusion, la tactique généralement adoptée consiste à rajouter du bruit sur le résultat puis à en enlever, pour que le résultat produit soit théoriquement nouveau. » S'il s'avère qu'il a été entraîné sur les images les plus célèbres de Tintin et Milou, ceci pourrait expliquer que nous n'ayons jamais vu d'image strictement ressemblante, mais en revanche obtenu plusieurs fois la silhouette caractéristique du journaliste et de son chien qui courent
Trois séries de tests de génération d'images sur Midjourney à la recherche du style de Hergé, l'inventeur de Tintin. Bizarrement, le premier résultat a suggéré des dessins ressemblant plus ou moins à Gavroche ou Harry Potter.
L'autre point de risque, continue Matthieu Quiniou, se situe en sortie. « Si l'image qui sort est caractéristique, reconnaissable, on peut tomber dans l'imitation, donc potentiellement dans la contrefaçon. »Midjourney modifie ses conditions d’utilisation en catastrophe
Mais revenons à notre histoire américaine. Le jour de Noël, Reid Southen est banni une seconde fois par Midjourney, ce qui ne l’empêche pas de publier le résultat de ses expériences. Il réalise par la même occasion que Midjourney a modifié ses conditions d’utilisations dans les jours précédents.
Capture des conditions d'utilisation de Midjourney telles que formulées le 21 décembre 2023.
Entre la sortie de la version 6 de son modèle, le 21 décembre, et la publication des premiers tests utilisateurs, l’entreprise a notamment ajouté un paragraphe pour tenter d’empêcher les usagers de chercher à violer des droits d’auteurs… mais aussi à tenter de prouver que celles-ci ont potentiellement eu lieu lors de l’entraînement du modèle.
Capture des conditions d'utilisation de Midjourney telles que formulées le 23 décembre 2023.
« Vous ne pouvez pas utiliser le service pour tenter de violer les droits de propriété intellectuelle d'autrui, y compris les droits d'auteur, les brevets ou les droits de marque. Si vous le faites, vous vous exposez à des sanctions, y compris à des poursuites judiciaires ou à une interdiction permanente d'utiliser le service », peut-on désormais y lire. Cette fouille est par ailleurs l’occasion de constater que l’entreprise emploie, en paragraphe 10, un ton menaçant : « Si vous enfreignez sciemment la propriété intellectuelle de quelqu'un d'autre et que cela nous coûte de l'argent, nous viendrons vous trouver et nous vous réclamerons cet argent. Nous pourrions aussi faire d'autres choses, comme essayer d'obtenir d'un tribunal qu'il vous fasse payer nos frais de justice. Ne le faites pas. »Une problématique plus large que pour le seul Midjourney
Rapidement, Reid Southen et Gary Marcus s’associent pour enquêter plus loin sur les potentielles violations de droits d’auteurs de différents modèles génératifs. Rendue publique le 27 décembre, la plainte du New-York Times contre Microsoft et Open AI met les deux hommes sur une piste : le document montre que ChatGPT est capable de reproduire, quasiment mot pour mot, des paragraphes entiers d’articles soumis aux droits d’auteurs.
Capture d'écran de la plainte du New-York Times contre Microsoft et OpenAI
Or, pointe Gary Marcus, ces technologies ne le font pas simplement avec du texte : elles sont capables de reproduire, quasiment mot pour mot, certaines des sources qui ont servi à leur entraînement. Et de faire le test avec Dall-E 3, modèle de génération d’images d’OpenAI construit, comme ChatGPT, à partir du modèle GPT-4. Gary Marcus obtient rapidement des images clairement tirées de Star Wars et de Bob l’éponge, sans même nommer les œuvres en question. Si bien que le scientifique en vient à spéculer sur la possibilité qu’OpenAI disparaisse, « WeWork style ». « Ils savaient que les violations de droits d’auteur seraient un problème majeur, ils ont quand même continué. Ça ne jouera pas en leur faveur face à un jury. Ça pourrait même les dévorer. »Des violations de droits d’auteur encouragées automatiquement ?
Pour avoir l’avis des principaux concernés, Next s'est plongé dans la liste de 4 700 noms produite dans le cadre de la plainte contre Stability AI et Midjourney. Entre Diane Arbus, Walt Disney et Wes Anderson, nous y avons trouvé une palanquée de concept artists qui travaillent dans le monde du cinéma et d'auteurs et autrices en manga. Et puis, en vrac, des noms de sculpteurs, de peintres, de photographes et de cinéastes francophones des deux siècles passés - Henri Matisse, Alain Resnais, Germaine Dulac, Claude Monet, Jean-Luc Godard, Yvonne Mariotte, etc. Nous y avons trouvé, aussi, beaucoup de dessinateurs de la tradition franco-belge - Hergé, Uderzo, Franquin -, des dessinateurs tout à fait vivants, comme Domitille Collardey ou François Bourgeon, et plusieurs street artists. Parmi ceux que nous avons contactés, Christian Guémy, plus connu sous le nom de C215, et Jean-François Perroy, alias Jef Aerosol, ont chacun témoigné d’ambivalences face aux prouesses technologiques des modèles génératifs. Auprès de Next, C215 explique avoir appris que son travail pouvait être plus ou moins repris par ces outils parce qu’on l’a « alerté, sur les réseaux sociaux ». Midjourney ne l’avait pas contacté. Pour l'avocat Matthieu Quiniou, le droit européen n'aide pas tellement, sur ce point : la directive 2019 sur la fouille du texte et des données a offert un avantage aux éditeurs d'intelligence artificielle en matière de récupération d'informations et d'œuvres. Mais C215 explique que, dans un sens, « c’est presque une satisfaction. C'est un quasi-marqueur de notoriété », de se retrouver ainsi repris, cité, par la machine ou les usagers. Ce que ces technologies produisent, est-ce, pour autant, de l’art ? Non, estime-t-il : « l’art, c’est proprement humain. » Et pour lui, être un artiste, « c’est créer du nouveau, de l’inattendu, de l’accidentel. » Si des internautes cherchent du « succédané » de ses productions, « que voulez-vous que j’y fasse ? », interroge-t-il. La copie, l’imitation, le plagiat, « c’est un débat vieux comme l’antiquité, dans le monde artistique ». Et pour le moment, l’artiste considère la version intelligence artificielle de l’affaire « plutôt anecdotique. C’est un gadget. » Ce qui ne signifie pas, souligne-t-il, qu’il faut jeter ces machines. Il faut les approcher « avec nuance ». Jef Aerosol, lui, découvre le phénomène. Comme C215, il pointe le fait que l’imitation, l’emprunt ou la copie font partie intégrante du cours artistique. Ce qui l’étonne, c’est plutôt que, sans le coup de fil de Next, il n’aurait « jamais su » que son nom figurait dans la feuille de style de Midjourney. Quelle limite fixe-t-il à la reprise des œuvres ? Du haut de ses 67 ans, l’artiste détaille : « ma carrière est bien installée, je ne suis pas procédurier. Je n’ai jamais engagé de poursuites, sauf s’il y a vraiment une volonté commerciale, pour vendre des t-shirts, des objets dérivés, par exemple, des choses que je ne fais pas du tout. » Dans le cas du principal modèle génératif qui nous occupe, il faut payer un abonnement pour créer et produire des images. Est-ce un motif de poursuites ? Jef Aerosol a demandé à voir les images produites pour se faire un avis. Nous lui avons transmis plusieurs tests, dont celui ci-dessous, inspiré par l'un de ses pochoirs.
Génération d'images de peinture au pochoir d'un garçon assis de dos, dans le style de Jef Aerosol, réalisée par Next avec Midjourney.
Matthieu Quiniou, lui, réitère : « si, en sortie, le résultat est reconnaissable, quand on fait "à la manière de" sans avoir demandé les droits à l'auteur, on produit de la contrefaçon. » En cas de besoin, il indique d'ailleurs que les artistes français peuvent tout à fait agir en contrefaçon, « en se rapprochant de leur société d'auteur, par exemple : l'ADAGP [société des auteurs dans les arts graphiques et plastiques, ndlr] se positionne pas mal sur le sujet. » En matière de droits d’auteur, après une année 2023 chargée en plaintes déposées aux États-Unis contre les principaux éditeurs de modèles génératifs, le changement d’année aura été riche en nouveaux rebondissements. Dans de prochains articles, nous plongerons plus avant dans les documentations disponibles des modèles poursuivis. Contactés par Next, Midjourney et plusieurs autres parties impliquées n'ont pas répondu à l'heure de publier. Nous mettrons l'article à jour le cas échéant. Vous même utilisez Midjourney ou un autre modèle génératif et vous avez réussi à générer des images particulièrement proches du style d’un artiste francophone ? Vous travaillez à construire ou améliorer des modèles génératifs et souhaitez en discuter ? Écrivez-nous, en commentaire ou par mail.