De l'or en Tube ?

OpenAI aurait puisé dans les vidéos de YouTube pour se créer un corpus de données d’entraînement utilisé notamment pour GPT-4. La plateforme de vidéos en ligne rappelle que cette pratique est contraire à ses conditions d’utilisation.
Dans la série des données utilisées par les entreprises d’IA génératives, le dernier épisode est un peu singulier. Jusque-là, les conflits concernaient soit des artistes, soit des éditeurs comme le New-York Times. Mais ici, il oppose OpenAI à YouTube, la plateforme de vidéos et filiale de Google qui est aussi l’un des acteurs majeurs du secteur de l’IA générative. Et celui-ci entend bien protéger sa chasse gardée.
- Le New York Times attaque OpenAI et Microsoft pour violation du Copyright
- IA générative : NVIDIA attaquée pour violation du Copyright
Selon des sources du New-York Times, justement, OpenAI aurait retranscrit plus d’un million d’heures de vidéos YouTube et les aurait ajoutées aux données d’entraînement de son modèle de langage GPT-4. Le conflit, ici, ne concerne pas le droit d’auteurs des vidéos, mais la violation des conditions d’utilisations de la plateforme de vidéos.