• FreeA
  • Posts
  • Moshi n'est PAS un concurrent d'OpenAI. C'est encore mieux.

Moshi n'est PAS un concurrent d'OpenAI. C'est encore mieux.

+ Il faut qu'on parle d'ElevenLabs

Hello,

Pas de newsletter la semaine dernière, j’ai pris des vacances en famille mais pas assez d’avance sur la newsletter 😅.

Je suis rentré hier donc celle d’aujourd’hui ne sera pas trop longue, on parlera de moshi (l’IA, pas le dessert), qui n’est PAS un concurrent d’OpenAI, mais peut-être encore mieux.
Ah, et il faut qu’on parle d’ElevenLabs. On assiste à la naissance d’un géant, mais j’ai l’impression que personne ne s’en rend compte, et qu’ils sont sous-côtés en France.

Théo

Il faut qu’on parle d’ElevenLabs

Leur site est magnifique et ultra fonctionnel + intuitif. Probablement mon préféré de toutes les boites d’IA.

On assiste à la naissance d’un géant. ElevenLabs est en train de créer un empire dans tout ce qui concerne l’audio, et personne n’en parle.
Alors qu’ils l’une des plus belles boites d’IA du monde.

Petite remise en contexte, et pourquoi je décide de vous en parler maintenant :

ElevenLabs, c’est à l’origine une entreprise qui se concentrait sur la génération d’audio à partir de texte grâce à l’IA. Le text-to-speech.

Et ils étaient bons. Très, très bons.
En fait, tellement bons qu’ils ont levés des centaines de millions, et que la concurrence a abandonné.

Sauf qu’ils ne se sont pas arrêtés là.

En plus de rémunérer les créateurs des voix IA les plus utilisées par la communauté et d’améliorer leur IA, ils ont commencé à sortir de nouvelles fonctionnalités.

Au départ, c’est allé doucement : le speech-to-speech, pouvoir cloner sa voix, le relier à un avatar…

Mais depuis quelques temps, ils accélèrent. Très fort.

Il y a quelques semaines, une nouvelle IA est apparue sur leur site. Un générateur de sons, pour du sound effect.
C’est une folie. Des dizaines de boites dont Meta, Google et Stability sont sur le sujet depuis maintenant quelques années, mais aucune solution disponible publiquement n’était vraiment fonctionnelle.

Et là, ElevenLabs débarque avec une IA quasi parfaite, qui génère les sons en quelques secondes.

Le monde de l’IA était choqué.
Mais ce qu’on savait pas, c’est que c’était que le début.

Parce que depuis, ElevenLabs a sorti :

  • Une application pour transformer sa voix en celle de la célébrité de notre choix (toutes celles présentes sur l’application sont consentantes)

  • Un studio de doublage pour traduire du contenu dans 29 langues différentes

  • Une IA d’isolation du son absolument démente. Je crois que je n’ai jamais vu une démo aussi bluffante. Regardez, ce sera plus rapide :

Et ça, c’est sans parler de toutes les solutions mises en place pour les entreprises pour des cas professionnels, voire même de leur API qui permet de faire des folies (des entreprises entières se basent dessus).

Ce court article, c’est un peu une déclaration d’amour à ElevenLabs, et un peu beaucoup une forte incitation à aller tester.
Rien que pour le côté “waouh” de générer de la voix en quelques secondes, si vous ne l’avez jamais fait, ça vaut le coup.

Alors allez testez ElevenLabs, et revenez me dire ce que vous en pensez.

PS : Mais avant ça, finissez de lire la newsletter bien sûr :)

Est-ce que vous voulez plus de sujets sur ElevenLabs ?

(De tests de leurs fonctionnalités, d'analyses techniques, etc)

Login or Subscribe to participate in polls.

Les liens au départ et en fin de cet article sont des liens affiliés. En cas de souscription de votre part à un abonnement payant chez Elevenlabs, je touche une légère commission. Je tiens à préciser que j’aurais parlé d’ElevenLabs même sans lien affilié, et que j’ai commencé à en parler avant d’obtenir ce lien.

Moshi n’est PAS un concurrent d’OpenAI. Mais c’est encore mieux.

Si vous vivez dans une grotte, Moshi, c’est la première pépite IA sortie par Kyutai, le laboratoire d’IA français fondé par Xavier Niel.

Sortie il y a une dizaine de jours, cette IA a eu un traitement médiatique en France qui m’a… surpris. Et déçu.

Pendant quelques jours, tous les médias se sont emparés de la nouvelle et ont présentés cette IA comme le nouveau fleuron de la technologie française, un miracle français venu concurrencer les méchants américains.
Moshi était présenté comme un concurrent d’OpenAI et de GPT-4o car comme lui, l’une de ses promesses était la réponse en temps direct.

La seule petite chose qu’ont oublié les médias français, c’est que Moshi ne fait que ça. Alors pour GPT-4o, c’est l’une de ses fonctionnalités.
Et il faut remettre en contexte que Moshi utilise un tout petit LLM choisi spécialement pour sa facilité d’utilisation dans le contexte d’une discussion en temps réel. Ce n’est pas le cas de GPT, bien plus coûteux et performant.

Attention. Je ne dénigre pas Moshi, c’est au contraire une vraie prouesse dont je dresserai bien des louanges juste après. Mais d’une bonne manière.

Je vais être honnête, j’ai été très frustré par les médias français. Pour une fois qu’ils parlaient tous d’IA, et pour une bonne nouvelle, il y avait de quoi changer l’opinion du grand public !

Sauf qu’ils ont fait la même chose que pour Mistral, ou H - tiens, c’est marrant, plus personne n’en parle. Et c’est symptomatique de quelque chose.

En France, les innovations technologiques sont perçues comme des bizarreries qui ne fonctionneront jamais, jusqu’à ce qu’elles obtiennent de l’argent américain et qu’on leur prête 1000&1 capacités irréalistes, avant de ne plus jamais en parler.

Dans le cas de Moshi, c’est un peu différent car on a Xavier Niel derrière, mais c’est le même schéma : personne n’en parlait jusqu’à maintenant, tout le monde le survend pendant quelques jours, et plus personnes n’en parlera avant la prochaine annonce.

Bref. C’était mon petit coup de gueule qui n’aura aucun impact. Mais faites attention à la prochaine grosse annonce d’une boite française, vous verrez ce schéma se répéter.

Maintenant, parlons un peu de Moshi.
Déjà, il faut se rendre compte de la prouesse : une équipe ultra réduite, des fonds peu profonds, et un temps très court. En 6 mois et avec extrêmement peu de ressources, ils ont sorti ce qui est aujourd’hui la meilleure IA de conversation en temps réel.

Et c’est là qu’il est temps de préciser leur force.

Non, vous n’utilisez pas Moshi au quotidien. Il ne va pas remplacer ChatGPT. En fait, moshi.chat est plutôt une démo pour faire un coup de com que leur vrai produit.

Le vrai intérêt, c’est que moshi est opensource. C’est à dire que n’importe qui peut l’installer sur son ordinateur et jouer avec.

Et ça, c’est fou.

Parce que c’est une énorme brique qui manquait à beaucoup d’entreprises faisant de l’IA ou voulant l’utiliser, qui est désormais utilisable extrêmement facilement.

Et c’est comme c’est opensource, le projet va s’améliorer grâce à la communauté, et permettre de beaux résultats. Quelques exemples qui me viennent en tête :

  • Pouvoir parler en temps réel aux personnalités célèbres de character.ai avec leur vraie voie grâce à ElevenLabs

  • Créer des supports téléphoniques qui répondent en temps réel et comprennent vraiment ce qu’on leur dit

  • Donner de la compagnie aux personnes dans le besoin, comme les personnes âgées isolées

Alors attention : je suis dithyrambique depuis tout à l’heure en ne présentant que les bons aspects de Moshi, mais il faut aussi être lucide sur ses limites : le LLM utilisé n’est pas très bon, l’IA est probablement gourmande en ressources lorsque téléchargé, et le résultat n’est pas encore parfait ; Moshi ne comprend pas toujours quand est-ce qu’il faut prendre la parole ou pas.

Mais c’est une première étape, et elle est belle.

Comment était la longueur de cet article ?

Login or Subscribe to participate in polls.

Et voici pour aujourd'hui !

On se retrouve jeudi !

En attendant, dis moi-ce que tu as pensé de la newsletter d'aujourd'hui !

Comment était la newsletter d'aujourd'hui ?

Login or Subscribe to participate in polls.

La remarque de la semaine dernière :

Merci beaucoup, ça fait plaisir à lire. C’était un vrai combat que de réussir à publier cette newsletter, mais la 2ème partie sera plus simple. Je vous ferai un feedback plus complet lorsque la deuxième partie sortira, mais je ne referai probablement plus de ce type de formats : ce dernier m’a bien plus coûté personnellement que prévu, alors savoir que ça vous plait, ça fait plaisir et ça rappelle pourquoi est-ce que le travail est fait.

PS : Cette newsletter a été écrite à 100% par un humain. Ok, peut-être 80%. 

Keep up with AI

How do you keep up with the insane pace of AI? Join The Rundown — the world’s largest AI newsletter that keeps you up-to-date with everything happening in AI, and why it actually matters in just a 5-minute read per day.

Reply

or to participate.