Hello,
Aujourd’hui, on couvre trois nouveaux modèles.
- Celui d’OpenAI fait peur aux écrivains,
- Celui de Tencent se montre petit et efficace,
- Celui de Google est mini mais aux des performances inédites.
Problème : ces derniers temps, c’est l’avalanche de nouveaux modèles d’IA toujours plus performants.
Alors on vous a préparé un récap de tout ce que vous devez savoir pour bien choisir vos outils.
Théo
Temps de lecture : 4mn15
we trained a new model that is good at creative writing (not sure yet how/when it will get released). this is the first time i have been really struck by something written by AI; it got the vibe of metafiction so right.
PROMPT:
Please write a metafictional literary short story… x.com/i/web/status/1…
— Sam Altman (@sama)
6:58 PM • Mar 11, 2025
OpenAI annonce avoir mis au point un nouveau modèle, spécialement entraîné pour l’écriture créative.
Sam Altman confie que c’est la première fois qu’un texte rédigé par une IA lui a “coupé le souffle”, tant le résultat semblait maîtriser l’émotion et la narration.
L’essentiel :
OpenAI affirme des performances inégalées pour la fiction et la narration.
Mais rien n’indique pour l’instant à quelle date ce modèle sera rendu public.
Sauf que pendant ce temps, les polémiques autour du droit d’auteur s’accentuent.
Aux États-Unis, plusieurs auteurs attaquent OpenAI pour utilisation non autorisée de leurs œuvres dans l’entraînement des modèles.
Conséquence : le gouvernement britannique envisagerait de simplifier l’usage des données protégées pour l’apprentissage des IA, suscitant la colère d’éditeurs et de créateurs.
Google vient de dévoiler Gemma 3, une nouvelle famille de modèles à moitié open-source avec pour ambition de rivaliser avec les meilleures IA du marché.
Pourquoi à moitié ?
Il s’agit de modèles open-weight : l’utilisateur peut les télécharger en local gratuitement pour un usage personnel, sans en modifier directement l’architecture.
L’essentiel :
Sur le classement LMArena, le score de Gemma 3-27B (1338 points) en fait l’un des meilleurs modèles ouverts disponibles.
Il bat aussi des records sur la compréhension multilingue (140+ langues) et la résolution de problèmes mathématiques (88,4 % sur GSM8K).
Contrairement à de nombreux modèles classiques, Gemma 3 peut traiter du texte, de l’image, et même de la vidéo.
Quatre variantes (1B, 4B, 12B, 27B) pour s’adapter aux besoins et ressources de chacun.
Elles sont disponibles sur Hugging Face et Kaggle, avec un hébergement simplifié via Google AI Studio ou Vertex AI.
Gemma 3 se veut être un modèle plus complet, capable de traiter de multiples formats avec une portée multilingue et un très long contexte.
Un sérieux concurrent pour les adeptes d’IA open source cherchant puissance et flexibilité. Reste à voir si la communauté sera réceptive à ce type d’offre.
🚀 Introducing Hunyuan-TurboS – the first ultra-large Hybrid-Transformer-Mamba MoE model!
Traditional pure Transformer models struggle with long-text training and inference due to O(N²) complexity and KV-Cache issues. Hunyuan-TurboS combines:
✅ Mamba's efficient long-sequence… x.com/i/web/status/1…— Hunyuan (@TXhunyuan)
2:31 PM • Mar 10, 2025
Tencent vient de lever le voile sur Hunyuan-TurboS, son nouveau modèle IA qui s’inspire de la pensée humaine pour allier vitesse et raisonnement en profondeur.
L’essentiel :
On retrouve deux modes :
Fast Thinking (pour des réponses rapides) lui permettant de donner des réponses presque deux fois plus vite par rapport à ses concurrents.
Slow Thinking (pour résoudre des problèmes complexes), qui assure une meilleure performance en mathématiques, logique ou code grâce à une son raisonnement en chaîne de pensée.
Sur des tâches requérant réflexion et alignement, TurboS rivaliserait avec GPT-4o et Claude 3.5 tout en gardant des coûts plus faibles.
Tencent n’a pas encore détaillé d’éventuels plans open source, mais une API est accessible via Tencent Cloud (avec un essai gratuit au lancement).
Même la Chine se met désormais à conjuguer performance et démocratisation de l’IA, se joignant à la course mondiale pour des solutions toujours plus polyvalentes et rapides.
Comment était cet article ?Aidez-moi à améliorer le format de la newsletter en me disant ce que vous avez pensé de cet article ! |
Il ne se passe pas une semaine sans qu’un géant de la tech ou un nouvel acteur surprise annonce un nouveau modèle d’IA révolutionnaire.
Qu’il s’agisse de Google avec Gemma 3, de xAI avec Grok 3, de Tencent avec Hunyuan-TurboS ou encore de DeepSeek, tous rivalisent d’innovations.
Multimodalité, raisonnement en chaîne, rapidité…
Sans oublier OpenAI, Anthropic, Mistral AI, Perplexity et tant d’autres qui enrichissent ou renouvellent leur catalogue.
Face à ce flot continu de modèles, comment savoir lesquels utiliser pour quel usage ?
Spoiler : tous ces modèles ne se valent pas, et leur usage dépend de vos besoins.
Utilisation occasionnelle ou professionnelle ? Traitement de données confidentielles ? Recherche ou création de contenu ? Petit budget ou possibilité d’investir ?
On va essayer d’y voir plus clair ensemble.
À suivre :
Bien choisir son IA,
En fonction des différents usages possibles,
Pourquoi tous les modèles se ressemblent.
Démarque-toi en moins de 10 minutes par semaine.
Déjà un(e) abonné(e) payant(e) ? Se connecter.
Reply