• FreeA
  • Posts
  • De prodige des échecs à CEO du plus grand labo d'IA

De prodige des échecs à CEO du plus grand labo d'IA

Toute l'histoire de DeepMind

Hello,

Vous avez été très nombreux à me demander d’où venait le plus grand labo de recherche en IA du monde : Deepmind.

Ils ont été pionniers dans l’industrie, anticipant la révolution à venir et prenant tout le monde de court.

Et même s’ils ne sont pas les leaders incontestés sur les LLMs, ils restent la figure de proue de l’IA dans des domaines moins médiatisés comme la médecine ou la recherche.

Aujourd’hui, on retrace l’histoire de cette entreprise fascinante !

Théo

Deepmind, la start-up qui a transformé l’IA

L’histoire du plus grand labo de recherche en IA du monde

En 2011, Google a un pressentiment : l’IA sera l’enjeu des décennies à venir.
Le géant d’internet a un nouvel objectif pour la décennie à venir :

Devenir pionniers dans l’innovation en IA.

Sauf qu’ils ne sont pas les seuls.
Une start-up britannique a déjà un an d’avance.

Pourtant, sur le papier, son équipe n’a pas de quoi effrayer Google et ses ingénieurs.

Demis Hassabis sort de Cambridge, Mustafa Suleyman a fait un bref passage chez Oxford, et Shane Legg est “seulement” diplômé de l’université d’Auckland en Nouvelle-Zélande.

Mais le projet de ces 3 jeunes à l’ambition folle va transformer l’IA à jamais.

Et ce, grâce à leur leader, dont le parcours force l’admiration :

Qui est Demis Hassabis ?

Demis Hassabis grandit dans une famille londonienne.
Et il a LE profil du surdoué.

Dès 4 ans, il est repéré pour son talent aux échecs.
À 13 ans, il atteint le niveau Master, avec un elo de 2 300.

C’est de la folie.
Pour vous donner une idée, il est dans le top 0,5 % mondial.

Il enchaîne les compétitions nationales, et gagne de quoi s’acheter son premier ordinateur.
Et c’est là que sa vie change.

Il découvre deux passions d’un coup : le code, et les jeux vidéo.
Demis continue à expérimenter pendant quelques années, jusqu’à finir son lycée à 16 ans.

Évidemment, toutes les portes lui sont ouvertes.
Enfin… Presque toutes.

Il y a un souci : Demis est trop jeune.
Cambridge propose de l’intégrer à une condition : il doit faire une année de césure.

Sauf que Demis ne compte pas se reposer sur ses lauriers.

Il gagne une compétition de code et intègre le studio de développement de jeux vidéo BullFrog.

À 17 ans, il dirige l’équipe de développement du jeu Theme Park.
Encore un succès pour le jeune prodige. Le jeu se vendra par millions d’exemplaires.

Après cette escale à Bullfrog, Demis Hassabis intègre Cambridge avec un objectif : révolutionner l’industrie du jeu vidéo.

Diplômé en 1997, il intègre directement un autre studio de développement, Lionhead.
À sa tête, l’ancien dirigeant de Bullfrog, Peter Molyneux.

Le studio décide de donner un défi à la hauteur des ambitions de Demis : il devient directeur de l’équipe de programmation en IA.

C’est là que tout prend sens pour lui.
Le terme “IA” est utilisé dans les jeux vidéo depuis des dizaines d’années déjà.

Sauf qu’il ne désigne pas des programmes très avancés.
Simplement des algorithmes responsables du comportement des personnages non-joueurs (PNJ.)

Et ça ne convient pas à Demis, qui ambitionne de transformer les jeux vidéo grâce à l’IA.
Alors il quitte LionHead pour créer son propre studio.

Mais rien ne se passe comme prévu.
Ses projets sont trop ambitieux, le développement trop long, et la technologie insuffisante.

En 2005, le studio ferme ses portes.
Pour tout le monde, c’est la fin de l’aventure pour Demis.

Il n’arrivera pas à révolutionner les jeux vidéos grâce à l’IA.
Alors il décide de faire l’inverse :

Révolutionner l’IA grâce aux jeux vidéos.

L’IA qui joue aux jeux vidéos

En 2010, Demis convainc deux amis de lancer un nouveau projet fou.
Une idée qui a germé dans son esprit il y a bien des années : révolutionner l’IA.

Deepmind est née.

Le projet ?
“Résoudre l’intelligence”

Notre objectif est de créer des agents artificiels capables d'atteindre un niveau équivalent de performance et d’adaptabilité.

Comme un humain, nos agents apprennent par eux-mêmes à développer des stratégies efficaces qui maximisent les récompenses à long terme.

David Silver, chercheur chez Deepmind

Sauf que l’équipe de Deepmind a une méthode particulière.
Leur architecture de modèle s’entraîne à devenir meilleure continuellement.

Et cet entraînement passe par un moyen unique : les jeux vidéo.
L’IA apprend à jouer avec pour but de devenir meilleure que les humains.

En 2013, Deepmind sort un premier modèle qui laisse toute l’industrie en état de choc : le Deep Q-Network (DQN.)

Deepmind devient alors pionnier de l’apprentissage par renforcement profond.
L’IA apprend de ses erreurs et est récompensé pour ses réussites.

Le but ?
Créer des modèles capables d’apprendre par eux-mêmes en simulant des millions de situations.

DQN doit apprendre à jouer à des jeux Atari 2600 – des classiques comme Breakout, Space Invaders, ou Pong – en partant de zéro.

Pas de règles explicites, pas de stratégie prédéfinie. Le modèle voit uniquement les pixels de l’écran et reçoit des récompenses en fonction de son score.

Chaque action, comme déplacer une raquette ou tirer sur un ennemi, est évaluée en fonction de ses résultats.

Une action qui augmente le score est récompensée, tandis qu’une mauvaise décision est pénalisée.

Sauf que la technologie en est encore à ses balbutiements.
Et ça pose problème.

Les modèles sont instables et les résultats peu fiables.
Mais Deepmind trouve rapidement la solution : utiliser les replays.

L’IA enregistre ses expériences et les rejoue de manière aléatoire pour mieux les analyser et en tirer des enseignements.

Résultat : DQN apprend à anticiper les conséquences de ses actions et à adopter des stratégies gagnantes.

Et en 2015, Deepmind publie ses résultats dans Nature.

Les chiffres parlent d’eux-mêmes : DQN atteint ou dépasse les performances humaines dans près de 50 % des jeux Atari testés.

C’est la première fois qu’une IA est capable d’être aussi polyvalente.
Et le modèle commence même à devenir vraiment meilleur que les humains.

Par exemple, dans Breakout, l’IA découvre seule une stratégie qu’aucun joueur n’avait envisagée.

Le modèle crée un tunnel dans les briques pour permettre à la balle de rebondir en boucle et maximiser les points. L’IA est “créative”.

Ce genre de comportement émergeant spontanément de l’apprentissage montre le potentiel immense de cette technologie.

Pour Deepmind, ces jeux sont des laboratoires d’expérimentation.

Ils permettent de tester et d’améliorer des algorithmes dans un environnement contrôlé, tout en posant les bases pour des applications bien au-delà des jeux vidéo.

DQN n’a pas seulement démontré que l’apprentissage par renforcement profond pouvait rivaliser avec les capacités humaines…

Il a aussi ouvert la voie à de nouvelles applications dans la recherche, la santé ou encore la logistique.

Pour Demis Hassabis et son équipe, ce modèle n’est qu’un chapitre dans une histoire beaucoup plus grande : la création d’une IA capable de comprendre et d’agir dans le monde réel.

Sauf que tous ces succès commencent à être connus du grand public.
Et un géant de la tech voit très vite le potentiel de Deepmind.

Mais tout ça, on le garde pour la partie 2.

Et voilà pour aujourd'hui !

On se retrouve jeudi !

En attendant, dis moi-ce que tu as pensé de la newsletter d'aujourd'hui !

Comment était cet article ?

Aidez-moi à améliorer le format de la newsletter en me disant ce que vous avez pensé de cet article !

Connexion ou S'abonner pour participer aux sondages.

PS : Cette newsletter a été écrite à 100% par un humain. Ok, peut-être 80%.

Reply

or to participate.