Fuite des talents : comment Xavier Niel veut faire rentrer au bercail les génies français de l’IA

Evénement ai-PULSE (Paris) – « J’espère que demain nos enfants utiliseront des algorithmes développés en France et dotés de nos spécificités culturelles ». Faisant le constat que les meilleurs chercheurs français en intelligence artificielle sont partis rejoindre les laboratoires privés des GAFAM, Xavier Niel s’est posé sur scène la question de la façon de les faire revenir au pays.

Ainsi, le fondateur de Free n’entend pas laisser les Etats-Unis et la Chine, en avance sur le terrain de l’IA, imposent leur vision du monde. « J’aimerais que l’on parle dans le futur d’impérialisme français dans l’IA ».

Pour concrétiser ce rêve, la réponse s’appelle Kyutai (prononcez « Cute AI » et signifiant « sphère » en Japonais), un laboratoire à but non-lucratif entièrement dédié à la recherche ouverte en intelligence artificielle. En rendant publics les produits de sa recherche fondamentale, il a vocation à contribuer à la démocratisation de l’IA. Ce mode dit d’open science s’oppose au mode de fonctionnement fermé des laboratoires de Meta ou de Google DeepMind.

Xavier Niel entend en faire un argument pour faire retraverser l’Atlantique aux génies français, au-delà de la qualité de vie à Paris. Doté de près de 300 millions d’euros Kyutai a également les moyens de ses ambitions. Ses trois cofondateurs, le groupe iliad (Free), le groupe CMA CGM et Schmidt Futures, l’entreprise philanthropique d’Eric Schmidt, ancien PDG de Google, ont chacun mis au pot.

« Il y a beaucoup d’idées en France mais pas assez d’argent, déplore Rodolphe Saadé, dirigeant de l’armateur CMA CGM. Avec cette enveloppe, unique en Europe, nous comblons ce manque. » La majorité de ce financement ira dans l’achat de puissance de calcul nécessaire pour faire tourner les futurs modèles. D’autres investisseurs privés sont invités aujourd’hui d’autres entités à les rejoindre pour financer sur le long terme les travaux de cette organisation « non profit ».

Yann Le Cun pour parrain

Xavier Niel assurera la première présidence de Kyutai dont le siège social sera basé sur dans le troisième arrondissement parisien. Pour orienter ses travaux, le laboratoire est doté d’un conseil scientifique dont fait partie Yann Le Cun, fondateur de Facebook AI Research (FAIR). Il partagera ensuite le fruit de ses recherches à la communauté scientifique, à l’écosystème de startups et plus largement à tout citoyen éclairé. Kyutai formera aussi les futurs experts de la discipline, via l’accueil en stages d’étudiants en master et la supervision de doctorants et post-doctorants.

L’open science consiste non seulement à partager le code source d’un modèle mais aussi le code qui a servi à son entraînement. « C’est souvent cette « sauce secrète » qui explique le succès du modèle », explique Hervé Jégou. Cet ancien de l’INRIA et de Facebook est l’un des six premiers chercheurs français à rejoindre l’aventure Kyutai avec Alexandre Défossez (FAIR), Edouard Grave (Apple MLR, FAIR), Laurent Mazaré (DeepMind), Patrick Pérez (Microsoft Research, Valeo) et Neil Zeghidour (DeepMind).

Créer un nouveau ChatGPT « from scratch »

Sur quels travaux travailleront-ils dans les mois à venir ? A la différence d’un Google DeepMind qui s’attaque à des problématiques très concrètes comme la prévision météo ou biologie moléculaire, Kyutai restera bien dans le domaine de la recherche fondamentale.

L’une des pistes évoquées porte sur le développement de grands modèles multimodaux qui génèrent du texte et des images mais aussi du son, en les dotant d’une perception visuelle et auditive. Une IA apprendra, par exemple, à dessiner en donnant un feedback à l’apprenti dessinateur sur le croquis en cours.

Kyutai entend créer, « from scratch », un grand modèle de langage (LLM), de type ChatGPT d’OpenAI ou Bard de Google afin de maitriser le socle technique et intervenir sur toutes les étapes de conception et d’entraînement. Il s’agit aussi de proposer une alternative aux modèles « Transformers » utilisé dans la plupart des applications de computer vision ou de génération texte. Enfin, un effort sera porté sur l’explicabilité des modèles pour éviter l’effet « boîte noire ».