#469 - Patrick Pérez - Kyutai - 300 millions pour l’IA en open source

Génération Do It Yourself - A podcast by Matthieu Stefani | Orso Media

"Vous avez quoi entre les mains ?" "De l'or !" Et ça, les trois milliardaires les plus en vogue l’ont bien compris. Xavier Niel (Free), Rodolphe Saadé (CMA-CGM) et Eric Schmidt (Google) ont financé à hauteur de 300 millions d’euros le laboratoire de recherche ouverte (open source) à but non lucratif dirigé par Patrick Perez, chercheur en IA appliquée. Patrick est à la tête de Kyutai, fondé en 2023, qui est déjà l’un des leaders français en IA, avec plusieurs outils disponibles : Moshi, leur IA vocale conversationnelle ; Hibiki, pour la traduction en live ; et MoshiVis, pour l’analyse d’images. Au programme de cet épisode : taxis autonomes, erreurs inhérentes à l’IA, entraînement des modèles par les humains, problème des contenus synthétiques… et là où l’IA est la plus lucrative. Avant de fonder Kuytai, Patrick a navigué entre recherche académique et industrie. Il a dirigé la stratégie IA chez Valeo, travaillé sur le traitement d’images chez Technicolor, et il a aussi mené des travaux chez Microsoft et à l’INRIA, deux références en innovation technologique. Ce parcours lui permet aujourd’hui de s’attaquer à l’un des sujets les plus prometteurs du moment : la multimodalité en IA — une approche qui combine texte, image et audio pour créer des outils plus puissants et plus intuitifs. Et bonne nouvelle, c’est la nouvelle vague de recherche qui sera à l’origine des prochaines grandes percées dans le domaine. Cet épisode est un point d’étape pour vraiment comprendre où en est la recherche en IA et comment se positionne la France. Entre fantasmes et réalités, Patrick explique comment fonctionne l’IA et comment elle capte peu à peu les signaux du monde réel — et pourquoi c’est une révolution. TIMELINE: - 00:00:00 : La beauté des mathématiques appliquées rendue accessible grâce à l’IA- 00:11:17 : Vers une IA vraiment multimodale : comprendre sans passer par le texte- 00:21:20 : Donner des yeux et des oreilles à l’IA- 00:30:17 : La rencontre entre IA et robotique : des robotaxis à Paris ?- 00:48:09 : Les prochaines avancées de l’IA vont TOUT changer- 00:55:20 : GPT se trompe encore… et c’est une bonne chose !- 01:00:51 : Quand la machine devient professeur pour d’autres machines- 01:08:33 : L’intervention des humains dans l’entraînement des IAs est encore nécessaire- 01:21:33 : Le problème des contenus synthétiques qui ne se présentent pas comme tels- 01:34:07 : Deviendrons-nous débiles en déléguant trop à l’IA ?- 01:42:40 : Là où l’IA est la plus lucrative- 01:53:09 : Convaincre des géants : Xavier Niel, Rodolphe Saadé, Eric Schmidt- 02:07:36 : L’IA pour coder : où en est-on ?- 02:15:59 : Ce qu’on peut faire avec l’IA et le coût des GPU Les anciens épisodes de GDIY mentionnés : - #450 - Karim Beguir - InstaDeep - L’IA Générale ? C’est pour 2025- #397 - Yann Le Cun - Chief AI Scientist chez Meta - L'Intelligence Artificielle Générale ne viendra pas de Chat GPT- #267 - Andréa Bensaïd - Eskimoz - Refuser 30 millions pour viser le milliard- #418 - Clément Delangue - Hugging Face - 4,5 milliards de valo avec un produit gratuit à 99%- #414 - Florian Douetteau - Dataiku - La prochaine grande vague de l’IA : l’adopter ou périr ? Nous avons parlé de : - KYUTAI- Moshi (l’IA de Kyuntai)- Inria : Institut national de recherche en sciences et technologies du numérique- Stéphane Mallard- Test des taxis autonomes Weymo : vidéo Insta- Documentaire aux US- Hibiki (outil de traduction)- Allen Institute for Artificial IntelligenceVous pouvez contacter Patrick sur Linkedin et sur Bluesky. Vous souhaitez sponsoriser Génération Do It Yourself ou nous proposer un partenariat ? Contactez mon label Orso Media via ce formulaire. Distribué par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.

Visit the podcast's native language site