• FreeA
  • Posts
  • Nvidia vient de dépasser OpenAI.

Nvidia vient de dépasser OpenAI.

Tout ce qu'il y a à savoir sur Nemotron, leur nouveau LLM.

Hello,

Cette semaine, une actu a fait les gros titres :
“Nvidia sort discrètement un LLM qui surpasse Claude 3.5 Sonnet et GPT-4o.”

Un coup d’éclat en termes de communication.
Mais quand on analyse cette nouvelle sortie de près, on se rend compte que Nvidia vient peut-être de commettre une grosse erreur.

Je vous explique tout ça.

Théo

Nemotron, l’IA qui fait peur aux géants.

Mais peut-être que vous devriez attendre un peu avant de l’utiliser…

Nous sommes sous le soleil californien, en 1993 à Santa Clara.
Jensen Huang a 30 ans et un beau poste chez AMD.

Mais une idée lui trotte dans la tête depuis des années.
Créer des puces graphiques ultra-performantes destinées aux gamers.

Un marché de niche à l’époque. Un risque à prendre.
Il décide de tenter sa chance.

Il fonde Nvidia avec 2 associés et en devient CEO.

Et c’est dur. Très dur.
Aucun des 3 jeunes hommes ne pouvait s’imaginer la réalité de l’entrepreneuriat.

Ils persistent, et Nvidia devient progressivement un des plus gros constructeurs de matériel graphique ultra-performant.

Mais l’histoire ne s’arrête pas là, parce qu’en 2021, le marché de l’électronique va prendre un coup de fouet qui n’a jamais été vu auparavant.

Avec l’explosion de la demande en IA, tout le monde a besoin de processeurs graphiques (GPU) pour entraîner ses modèles.

Ça tombe bien, parce que c’est la spécialité d’Nvidia.

La suite appartient à l’histoire.
Le 24 juin 2024, l’entreprise dépasse Microsoft et devient la boîte la plus valorisée au monde avec 3,3 milliards de milliards de capitalisation.

Tout semblait aller pour le mieux.
Sauf qu’ils viennent de changer toute leur stratégie.

Il y a 4 jours, ils ont sorti un LLM, le Llama-3.1-Nemotron-70B-Instruct.
Le monde était sous le choc.

Le modèle surpasse GPT-4o et Claude 3.5 sur plusieurs indicateurs.
Une folie.

Mais est-ce que vous devriez migrer tout de suite vers ce nouveau venu ?

Le petit nouveau…

Nemotron a été entraîné de manière un peu différente que ses grands frères.

Il est basé sur le modèle open-source de Meta, Llama 3.1.
L’open-source offre un terrain de jeu parfait aux développeurs, qui peuvent construire de nouvelles innovations sur une base solide.

Ils ont fait le choix de l’humanisation du modèle, avec l’utilisation du Reinforcement Learning from Human Feedback (RLHF).

Cette méthode permet à l’IA de mieux comprendre les préférences humaines et d’adapter ses réponses de manière plus naturelle et intuitive.

Nemotron n’a pas besoin de prompts supplémentaires pour des questions délicates.

Certains utilisateurs ont fait des comparaisons de style d’écriture avec ses concurrents :

D’ailleurs, vu que le modèle est open-source et testable gratuitement, vous pouvez déjà vous faire votre propre avis :

Plus une IA est capable de produire des réponses humaines, plus le marché répond positivement.

Mais malgré ce coup d’éclat, est-ce que ce petit nouveau peut faire le poids face à GPT-4o et Claude 3.5 ?

On dirait que oui.
Voici une comparaison des scores sur différents benchmarks :

Arena Hard

Alpaca Eval

Nemotron

85

57.6

Claude 3.5 Sonnet

82

34.9

ChatGPT-4o

71

57.5

Là où Claude 3.5 peut faire des erreurs bêtes sur des questions abstraites et où GPT-4o excelle en polyvalence, Nemotron se distingue par sa capacité à offrir des réponses plus nuancées.

Sauf qu’il y a d’autres éléments à prendre en compte avant de se ruer vers Nemotron.

  • Ces classements peuvent évoluer rapidement.

  • L’évaluation est faite sur des critères généralistes.

  • Nemotron est bon, mais n’est pas spécialisé sur un domaine spécifique.

Nvidia a été clair : son modèle reste un petit nouveau.
Il n’a pas encore été optimisé pour des tâches nécessitant une extrême précision, comme le raisonnement mathématique ou juridique.

Donc il faut conserver une certaine prudence lorsqu’on l’utilise dans des secteurs sensibles.

Mais le fait que cette réserve ait été émise par les créateurs du modèle soulève une question :

Est-ce que Nvidia est vraiment prêt à s’attaquer à un nouveau marché ?

Pourquoi vouloir tout faire ?

L’IA est une ruée vers l’or moderne pour l’industrie de la tech.
Nvidia est arrivé au sommet en vendant les pelles.

Ils ont le matériel le plus performant à un moment où la demande est plus forte que jamais.

Avec Nemotron, ils sortent de leur domaine d’expertise.

Et ils ne sont pas les seuls.
Beaucoup d’entreprises cherchent à construire leur propre écosystème centralisé pour ne dépendre d’aucune autre entreprise dans l’industrie.

Le monopole d’une boîte comme OpenAI à la fois sur le software et le hardware ferait peur à tout le monde.
Sauf qu’en fait, c’est déjà le cas : eux aussi ont décidé de se diversifier.

Même s’ils restent très évasifs sur le sujet, ils envisagent d’arrêter de se fournir uniquement chez Nvidia pour leur matériel, voire carrément de construire leurs propres machines (c’est en tout cas les rumeurs qui courent depuis un bon moment).

Les enjeux sont importants :

Ceux qui s’imposeront comme les GAFAM de demain seront les plus autonomes et adaptables aux nouvelles innovations.
Pour ça, le mieux, c’est de n’être dépendant de personne, que ce soit pour le software ou le hardware.

Les entreprises l’ont bien compris.
Alors elles n’ont pas le choix : il faut tenter innover.

En ce moment même, de nombreuses entreprises spécialisées en software ou en hardware travaillent pour lier les deux.

C’est en train de transformer nos produits, surtout ceux du quotidien.

Mais ça, on en parle jeudi ;)

Et voilà pour aujourd'hui !

On se retrouve jeudi !

En attendant, dis moi-ce que tu as pensé de la newsletter d'aujourd'hui !

Comment était la newsletter d'aujourd'hui ?

Connexion ou S'abonner pour participer aux sondages.

La remarque de la semaine dernière :

Merci pour ce commentaire !

Je ne pense pas que le temporaire soit possible, simplement au vu de l’investissement requis. Surtout, en cas d’accident qui aurait pu être évité si c’était activé en permanence, la responsabilité et le retour de baton serait trop fort.

Sur la question de l’autoritarisme et de l’effet définitif, rien n’est défini.
On est encore aux balbutiements de ces questions, et c’est là l’intérêt d’en parler, de vulgariser et de mettre en place des réglementation pour éviter les abus.

En parlant de réglementations, on fera une édition dédiée à ce qui se fait dans l’IA, parce qu’il y a beaucoup de choses à dire !

PS : Cette newsletter a été écrite à 100% par un humain. Ok, peut-être 80%.

Reply

or to participate.