La bataille se rejoue

En octobre dernier, l’Open Source Initiative a publié la version 1.0 de sa définition de l’IA ouverte, mais des acteurs du milieu du logiciel libre n’en sont pas satisfaits. Ils s’organisent autour de Sam Johnston pour peser sur la définition qui sera utilisée en Europe lors du AI Action Summit organisé par l’Élysée les 10 et 11 février.
La définition de l’IA ouverte (le terme utilisé internationalement est « open source ») est un enjeu important dans la régulation du secteur. L’AI Act européen s’appuie notamment sur ce terme pour exonérer leurs concepteurs de certaines obligations :
« Les tiers qui rendent accessibles au public des outils, services, processus ou composants d’IA autres que des modèles d’IA à usage général ne devraient pas être tenus de se conformer aux exigences visant les responsabilités tout au long de la chaîne de valeur de l’IA, en particulier à l’égard du fournisseur qui les a utilisés ou intégrés, lorsque ces outils, services, processus ou composants d’IA sont rendus accessibles sous licence libre et ouverte ».
En octobre, l’Open Source Initiative (OSI) a publié la version 1.0 de sa définition de l’IA. Pendant les différentes phases d’élaboration de cette définition, les informations sur les données utilisées pour entrainer les IA étaient au centre des discussions. Des entreprises comme Meta, qui considère que ses modèles Llama sont les leaders de l’IA open-source, ne veulent absolument pas donner de détail sur les données qu’elles utilisent. De l’autre côté, certains acteurs de l’open source comme Linagora insistaient pour que ne soient considérées comme ouvertes que les IA dont sont connues les données d’apprentissage.
Une définition qui fait des remous du côté de Debian
Au final, la définition 1.0 de l’OSI insiste sur le besoin d’une « description complète » des données utilisées pour entrainer le modèle sans pour autant exiger que ces données soient totalement connues. Cette définition a convaincu certains acteurs comme Hugging Face, Linagora, :probabl. ou Mozilla qui l’ont officiellement approuvée.
Mais des développeurs de Debian ont eu des positions assez virulentes contre cette définition sur leur liste de discussion. L’un d’entre eux, Mo Zhou, expliquait par exemple, que « les systèmes d’IA sont des logiciels et (pour citer Bruce Perens, auteur du DFSG [Debian Free Software Guidelines] et de l’OSD [Open source definition] et fondateur de l’OSI) les données d’entraînement sont la source, de sorte que l’OSAID [open source artificial intelligence definition] est fondamentalement incompatible avec l’OSD ». Rappelons aussi que la définition de l’open source a dérivé des Debian Free Software Guidelines (DFSG), comme l’explique aussi l’OSI à la fin de son texte.
Un autre développeur de Debian opposé à la définition de l’OSI, l’australien Sam Johnston, a entamé des démarches pour construire une organisation sur une définition qui inclurait clairement la publication des données d’entrainement. Il propose notamment le brouillon d’une autre définition, qui s’appuie aussi sur la définition originelle de l’open source. Celle-ci commence par affirmer :
« L’open source ne signifie pas seulement l’accès à la source, mais la liberté pour les utilisateurs d’étudier, d’utiliser, de modifier et de partager le programme, pour n’importe quel but et sans avoir à demander la permission. Dans les cas où le logiciel repose sur des données – y compris des bases de données, des modèles ou des médias – pour sa création, sa modification ou son fonctionnement, ces données sont considérées comme faisant partie intégrante du programme et sont soumises aux mêmes exigences. »
Une nouvelle structure : l’Alliance pour l’Open Source
Nos confrères de Contexte ont obtenu sa proposition de participation au AI Action Summit (Sommet pour l’action sur l’Intelligence Artificielle) organisé par l’Élysée les 10 et 11 février dans laquelle il explique qu’une « Alliance pour l’Open Source » (AOS) est en train d’être mise en place. Celle-ci miserait notamment « sur la France en tant que centre stratégique pour encourager la collaboration et l’innovation dans le domaine de l’Open Source ».
Et étonnamment, alors que Linagora et :probabl. ont approuvé le texte de l’OSI, Sam Johnston y explique « de récentes réunions productives avec Yann Lechelle, PDG de :probabl. et Alexandre Zapolsky de LINAGORA, ont permis d’initier un effort de sensibilisation organisé pour impliquer les groupes nationaux de logiciels libres en tant que primo-adoptants et collaborateurs, contribuant ainsi a jeter les bases de la formalisation de l’AOS dans l’arène publique ».
Il espère aussi pouvoir rallier l’association April, le projet Debian, la Free Software Foundation Europe, OpenForum Europe, Linux Australia, la Free Software and Open Source Foundation for Africa, OpenUK ou encore les structures internationales que sont la Software Freedom Conservancy, la Free Software Foundation, Digital Public Goods Alliance, la fondation Linux ou la fondation Apache.
Avec cette nouvelle organisation, Sam Johnston, veut « maintenir l’intégrité des principes de l’Open Source ».