Quantcast
Channel: Next - Flux Complet
Viewing all articles
Browse latest Browse all 3807

IA générative : GPT-4 entrainé avec un million d’heures de vidéos YouTube

$
0
0
De l'or en Tube ?
Deux requins étiquetés par portions avec les marques des entreprises d'IA génératives nagent dans l'océan

OpenAI aurait puisé dans les vidéos de YouTube pour se créer un corpus de données d’entraînement utilisé notamment pour GPT-4. La plateforme de vidéos en ligne rappelle que cette pratique est contraire à ses conditions d’utilisation.

Dans la série des données utilisées par les entreprises d’IA génératives, le dernier épisode est un peu singulier. Jusque-là, les conflits concernaient soit des artistes, soit des éditeurs comme le New-York Times. Mais ici, il oppose OpenAI à YouTube, la plateforme de vidéos et filiale de Google qui est aussi l’un des acteurs majeurs du secteur de l’IA générative. Et celui-ci entend bien protéger sa chasse gardée.

Selon des sources du New-York Times, justement, OpenAI aurait retranscrit plus d’un million d’heures de vidéos YouTube et les aurait ajoutées aux données d’entraînement de son modèle de langage GPT-4. Le conflit, ici, ne concerne pas le droit d’auteurs des vidéos, mais la violation des conditions d’utilisations de la plateforme de vidéos.

Recherche données d’entraînement désespérément


Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.


Viewing all articles
Browse latest Browse all 3807

Trending Articles