Hello,

Sauf que Meta fait partie des entreprises qui utilisent une approche spéciale pour leurs modèles d’IA : l’open-source.

Théo

LinkedIn vient d’enfreindre toutes les lois de protection des données pour entraîner des modèles d’IA, et ça pourrait leur coûter cher.

L’essentiel :

LinkedIn est accusé d'avoir partagé les messages privés de ses utilisateurs Premium à d’autres entreprises pour entraîner des modèles d'IA.

Pour résumer :

  • En août 2024, LinkedIn met en place une option “autoriser le partage de mes données à des fins d’entraînement d’une IA". Sauf que l’option était cochée automatiquement, forçant beaucoup d’utilisateurs dans le programme sans qu’ils ne soient mis au courant.

  • En conséquence, une plainte a été déposée en Californie, demandant $1 000 par utilisateur affecté. Le procès accuse la plateforme d’avoir tenté de "couvrir ses traces" en modifiant sa politique après coup.

Le cas LinkedIn est important. Il permet de rappeler l’importance de régulations internationales sur la gestion des données.

En Europe, on a déjà l’AI Act et la RPGD. Mais aux Etats-Unis, que va-t-il arriver aux données utilisateurs en l’absence d’un cadre concret ?

On fera bientôt une édition complète dédiée à l’utilisation des données par les entreprises d’IA, et comment vous pouvez vous protéger.

L’entreprise de Mark Zuckerberg vient de prendre un nouveau cap, avec un investissement de 60 milliards.

L’essentiel :

Meta investira entre $60 et $65 milliards en 2025 pour développer ses infrastructures axées sur l'IA :

  • Ils vont construire un immense centre de données en Louisiane de plus de 360 000 m2, décrit comme pouvant "couvrir une partie de Manhattan."

  • En plus d’acquérir plus d’1,3 million de GPU pour alimenter les algorithmes d'IA de Facebook, Instagram et WhatsApp.

  • Et d’ajouter 1 MGW de calcul à leurs solutions pour soutenir ses capacités technologiques.

Cette annonce de Zuckerberg ne sort pas de nulle part : elle est une réponse directe au projet StarGate porté par OpenAI et le gouvernement, qui exclut Meta de ses projets.

Comment était cet article ?

Aidez-moi à améliorer le format de la newsletter en me disant ce que vous avez pensé de cet article !

Login or Subscribe to participate

Focus : open-source, la guerre de l’ombre

L'IA est divisée en deux camps.

D'un côté, les modèles open-source comme ceux de Mistral, LLaMA et DeepSeek, portés par une philosophie d'ouverture et de collaboration (sur le papier).

De l'autre, les modèles privés d'OpenAI, Google et Anthropic, qui misent sur la performance et la protection de leurs innovations.

Sauf que le conflit n’est pas aussi binaire.

Les entreprises open-source se mènent une guerre intestine pour imposer leurs modèles sur leurs marchés locaux, mais surtout à l’international.

Pourquoi l’open-source ?

L’architecture (et parfois les données d’entrainement et paramètres) d’un modèle open-source sont accessibles à tous.
Concrètement, ça signifie deux choses :

  • Les utilisateurs du quotidien peuvent télécharger le modèle en local et faire du fine-tuning : personnaliser le modèle à fond à partir de leurs données.

    Données qui restent sur votre IA en local, inaccessibles pour les boîtes à l’origine de l’IA que vous utilisez.

  • Pour les développeurs et les entreprises, c’est quasiment la même chose : plus de possibilités de personnalisation tout en restant maître de ses données.

    Sauf qu’en plus, pour créer des projets avec de l’IA intégrée, c’est beaucoup plus facile. Et souvent moins cher.

PS : C’est une version extrêmement simplifiée, et partiellement inexacte mais suffisante pour cette article. Est-ce qu’une édition où on détaillerait le fonctionnement de l’open-source et pourquoi tout le monde en parle autant vous intéresserait ?

Vous souhaitez lire une édition détaillée sur l'open-source ?

Login or Subscribe to participate

Voici comment télécharger une IA open-source sur votre ordinateur :

  1. Téléchargez LM Studio depuis son site officiel en fonction de votre système d’exploitation.

  1. Dans LM Studio, allez dans l’onglet « Discover » et recherchez le modèle de votre choix.

  2. Une fois téléchargé, accédez à l’onglet « Modèles Locaux ».

  3. Chargez le modèle et commencez à interagir avec le modèle sans connexion Internet.

En plus, la plupart ont une interface en ligne permettant d’accéder et de tester le modèle, similaire à un ChatGPT mais souvent gratuite.

Plusieurs start-ups ont fait le choix de créer ce type de modèles pour concurrencer les géants du marché, dont OpenAI qui reste très fermée.

Sur le marché américain, on retrouve un produit de Meta, l’entreprise de Mark Zuckerberg : Llama 3.

LLaMA : la stratégie hybride de Meta

Meta est une des seules entreprises américaines à proposer de l’open-source.
Parce qu’ils ont un avantage de taille : leurs infrastructures.
(Et parce qu’ils avaient trop de retard sur les modèles propriétaires)

Les modèles LLaMA bénéficient de l’énorme puissance financière et matérielle de Meta.

Conséquence : ils sont pré-entraînés sur des ensembles de données massifs et offrent des performances proches des modèles privés.

Mais l’open-source permet à Meta de se démarquer sur son marché local en rendant l’IA accessible à la communauté de chercheurs et aux entreprises.

Nous avons fait le choix de l’ouverture pour favoriser l’innovation.

Ils ciblent presque exclusivement la niche américaine à tel point Meta.AI, le portail vers la version en ligne de Llama, n’est pas encore accessible en Europe. (Et aussi pour une question de gestion des données où Meta n’est pas très clean)

Vous pouvez quand même y accéder si vous avez un VPN réglé sur Etats-Unis, ou en utilisant le modèle en local.
Mais heureusement, il y a une autre option : l’IA européenne.

Mieux : son champion, basé dans l’hexagone.

Mistral : le champion européen

Mistral, start-up française fondée par d'anciens chercheurs de DeepMind et Meta, s'est imposée en quelques mois comme un acteur majeur.

Leur approche ? Publier des modèles en open-source via de simples liens torrents, sans faire d’annonces en grande pompe.

Sauf que cette stratégie leur sert à attirer des utilisateurs grand public et à démontrer leurs capacités, pour ensuite vendre des licences commerciales aux entreprises.

La version en ligne de Mistral s’appelle Le Chat, et elle égale les performances de ChatGPT-4o :

Mistral prouve qu'il est possible de rivaliser avec OpenAI tout en restant open source.
Surtout, l’entreprise illustre la pertinence du choix de l’ouverture.

Parce qu’en adoptant des modèles ouverts, l’accès à l’IA est facilité, permettant d’attirer de nombreux talents et développeurs internationaux.

(Petite nuance : Mistral garde parfois ses modèles les plus performants ou innovants temporairement en propriétaire uniquement)

Cette approche pourrait grandement aider l’Europe à développer sa souveraineté technologique.

En laissant l’IA libre d’accès, la compétitivité est favorisée tout en permettant au vieux continent de rester indépendant.

Le problème, c’est que l’IA est un marché international.
Et la compétition fait rage. Même entre modèles open-source.

Celui qui aura le modèle le plus performant et le moins cher attirera le plus d’utilisateurs.
Premier arrivé, premier servi.

DeepSeek : une ouverture sous contrôle

Mais en Chine, DeepSeek joue un double jeu.

La start-up utilise la même méthode qui lui a permis de s’imposer en Chine pour devancer la concurrence mondiale.

En raison de ses prix cassés, DeepSeek impose une guerre des prix en rendant ses modèles très abordables. Gratuit sur leur site, et une API 96% moins cher qu’OpenAI.

Mais cette stratégie n’est pas seulement économique : en misant sur l’open-source, ils attirent une communauté de développeurs internationale.

Sauf que ces modèles open-source sont sans doute les moins ouverts.
Parce que le gouvernement chinois est impliqué dans leurs développements.

D’une part pour faire face à l’hégémonie américaine, mais aussi pour assurer la continuité de l’idéologie chinoise jusque dans l’IA.

C’est juste fou, parce que ça va jusqu’au négationnisme.
Exemple : le modèle refuse de parler du massacre de Tiananmen.

Après, utiliser le modèle en local permet de résoudre le problème. Mais pour la majorité des utilisateurs qui ne prendront pas la peine de le faire, c’est un réel problème.

Bref, derrière cette apparente ouverture, des biais gouvernementaux et une censure stricte risquent de créer un vrai conflit sur l’adoption du modèle à l’international.

Qui sortira vainqueur de cette guerre de l’ombre ?
Quels enjeux pour l’avenir des entreprises et des solutions IA ?
Est-ce que les prix cassés seront plus puissants que la transparence des entreprises ?

Impossible à prédire.
Alors on vous tiendra au courant.

Comment était la newsletter d'aujourd'hui ?

Login or Subscribe to participate

PS : Cette newsletter a été écrite à 100% par un humain. Ok, peut-être 80%.

Reply

or to participate

Keep Reading

No posts found