« Une sorte de bêta »

Elon Musk a présenté cette nuit la prochaine version de son intelligence artificielle générative maison, Grok 3. Présenté comme plus performant que la concurrence, le nouveau modèle est en fait une famille et va disposer d’un mode « raisonnement ». Ses résultats les plus précis seront en revanche accessibles depuis une option payante pour les abonnés.
C’est au cours d’une retransmission en direct que xAI, l’entreprise d’Elon Musk dédiée à l’intelligence artificielle, a présenté la nouvelle famille Grok 3. Il a surtout été question du modèle principal et de ses performances.
Le nouveau modèle a été entrainé sur le supercalculateur Colossus, lancé l’année dernière avec 100 000 GPU H100 de NVIDIA. Elon Musk a précisé que l’entrainement avait bénéficié d’une puissance dix fois supérieure à celle utilisée pour Grok 2. Les données sont décrites comme beaucoup plus nombreuses que précédemment, avec notamment des dépôts de dossiers d’affaires judiciaires, comme le rappelle notamment TechCrunch.
« Plus fort » que la concurrence
Très vite, les performances de Grok 3 ont été abordées. Sans surprise, le nouveau modèle est présenté comme plus puissant que la concurrence, particulièrement GPT-4o, Claude 3.5 Sonnet, Gemini 2.0 Pro et même DeepSeek. Sur les graphiques fournis par xAI, le dernier modèle génératif « classique » d’OpenAI est même battu à plate couture.

Les tests utilisés par xAI pour comparer son modèle sont notamment AIME (pour l’évaluation des performances sur les problèmes mathématiques), GPQA (pour les problèmes de physique, biologie et chimie), ainsi que LCB pour les performances en développement logiciel. La présentation a également abordé Chatbot Arena, dans lequel Grok 3 s’en tire encore premier.
« Grok 3 est beaucoup plus performant que Grok 2. C’est une IA qui recherche au maximum la vérité, même si cette vérité va parfois à l’encontre de ce qui est politiquement correct », a affirmé Elon Musk.

Et sur le raisonnement ?
xAI était également attendue de pied ferme sur les modèles dits « de raisonnement ». L’expression désigne les modèles capables de « raisonner » sur leurs réponses pour en évaluer la précision. Le processus, nettement plus couteux en puissance de calcul, permet d’éviter de nombreux pièges élémentaires des IA génératives.

Dans ce domaine, l’entreprise avait aussi des annonces à faire. Elle a comparé la variante Reasoning à o3 mini, o1, DeepSeek R1 et Gemini 2.0 Flash Thinking, là encore pour remporter haut la main le combat. Même la version mini de Grok 3 Reasoning ferait mieux que la concurrence. Les scores ont été obtenus encore une fois sur une série de benchmarks, dont la mouture 2025 du test mathématique AIME.
Toutes les capacités de Grok 3 et de la fonction DeepSearch seront disponibles au travers de l’API d’ici « quelques semaines ».
Quelle disponibilité ?
Peut-on utiliser Grok 3 ? Oui, mais uniquement si vous disposez d’un abonnement Premium+ sur X, dont le tarif en France commence à 21,90 euros par mois. Le nouveau modèle est en cours de déploiement depuis cette nuit, il ne sera donc peut-être pas utilisable sur l’ensemble des comptes à l’heure où nous publions ces lignes.
Mais attention, car la formule Premium+ n’est qu’une porte d’entrée pour la version standard. Si vous souhaitez utiliser les capacités de raisonnement, il faudra attendre que xAI propose le pack SuperGrok, qui devrait être lancé « bientôt » au prix de 30 dollars par mois (ou 300 dollars par an), somme qui viendra s’ajouter au tarif déjà payé pour Premium+.

La formule débloquera également les capacités DeepSearch, réponse de xAI à OpenAI pour tout ce qui touche à la récupération d’informations sur le web (fonction Recherche approfondie). DeepSearch puise aussi dans le réseau X et pourra en outre fournir des analyses sur les informations et en livrer un résumé. Des fonctions désormais communes sur ce type d’outil.
Elon Musk a en outre annoncé l’arrivée d’un mode vocal pour Grok 3 dans une semaine. Peu de détails ont été fournis, sinon qu’il dotera à l’interface associée au modèle la possibilité d’échanger par la voix, comme ce que propose notamment ChatGPT dans ses applications.
Enfin, xAI a promis d’ouvrir les sources de son nouveau modèle, « quand le suivant sera prêt ». La firme gardera ce fonctionnement, attendant qu’un certain modèle soit « assez mûr », pour libérer les sources du précédent. Dans le cas de Grok 3, cela devrait prendre « quelques mois ». Les sources de Grok 2 seront alors libérées. Quant à celles de Grok 3, il faudra bien sûr attendre Grok 4, sur lequel l’entreprise n’avait rien à ajouter.
Reprendre la main
Les annonces tonitruantes sur le plan des performances ont été faites dans le calme. Elon Musk a joué la carte de la présentation tranquille, entourée pendant la retransmission de trois membres de xAI.
Pourtant, ce descriptif calme cachait une opération de communication bien rodée destinée à détourner l’attention d’un OpenAI au centre de bien des projets. Lorsque Donald Trump a présenté lui-même les grandes lignes du projet Stargate et ses investissements pouvant aller jusqu’à 500 milliards de dollars. Un projet pharaonique dont OpenAI est la pièce maitresse, puisque les centres de calculs en construction ou qui le seront serviront à entrainer ses modèles. Aucune autre entreprise spécialisée en IA ne fait partie du programme.
Elon Musk avait rapidement fait part de son avis sur la question en accusant Sam Altman, cofondateur et CEO d’OpenAI, de ne pas avoir l’argent nécessaire pour un tel projet. Il l’avait accusé de mentir, alors que le projet était présenté quelques heures plus tôt par le président américain, dont il est désormais un proche. Il y a quelques jours, Elon Musk a même proposé à OpenAI un rachat pour 97,4 milliards de dollars. Une offre plus ou moins poliment refusée par Sam Altman, qui a proposé en échange un rachat de X pour 9,74 milliards de dollars.
En outre, la présentation de Grok 3 ne s’est pas déroulée sans quelques piques à OpenAI. Certains graphiques montraient par exemple combien xAI avait progressé en peu de temps, là où il avait fallu des années à OpenAI pour parvenir à un tel résultat. Dans la course à l’intelligence artificielle, Elon Musk investit lourdement pour attirer les clients et les investisseurs. Mais les performances réelles de Grok 3 et de ses variantes, particulièrement Reasoning, restent à constater.
Au-delà des pures notes de synthèse dans les benchmarks, Musk s’est d’ailleurs montré prudent sur la question. « Nous devons souligner qu’il s’agit d’une sorte de bêta, ce qui signifie que vous devez vous attendre à quelques imperfections au début, mais nous allons l’améliorer rapidement, presque tous les jours », a-t-il ainsi déclaré pendant la présentation.