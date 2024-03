Pendant que plusieurs géants de la Silicon Valley resserrent l’accès aux codes de leurs modèles d’IA générative, c’est l’exact contre-pied que tente de prendre Kai-Fu Lee, informaticien et homme d’affaires taïwanais basé à Pékin. Sa volonté ? Structurer un écosystème fondé sur un modèle de langage open source performant dont les start-up chinoises seront les premières bénéficiaires.

Après un passage chez Apple et Silicon Graphics, cet expert mondialement reconnu de l’IA a participé à la création de Microsoft Research Asia, organisation qui a contribué à la formation d’un grand nombre d’ingénieurs chinois de premier plan. Kai-Fu Lee a également présidé l’activité recherche de Google en Chine.

La concurrence commerciale entre les géants de l’IA va peu à peu s’intensifier. Celle-ci opposera vraisemblablement des écosystèmes construits autour de l’exploitation des différents modèles de langage disponibles. Selon Kai-Fu Lee, l’écosystème qui s’imposera sera enraciné dans un modèle de langage open source de petite taille et facile à entraîner. Il regroupera un grand nombre d’ingénieurs informés des dernières avancées technologiques et capables de transformer celles-ci en applications commercialisables. Ces ingénieurs auront été très tôt familiarisés aux détails du modèle de langage qu’ils exploitent. Formés dans une institution qui inclut une activité de capital-risque, ils sauront développer des idées à haut potentiel commercial et susceptibles d’attirer les financements les plus importants.

Tel est l’environnement qu’il a cherché à bâtir depuis maintenant 15 ans.

Sinovation pose les fondations

En 2009, l'ingénieur lance Sinovation, une société de capital-risque spécialisée dans le financement de start-up technologiques. Durant les premières années, la firme opère aux États-Unis et en Chine. L’intensification de la guerre commerciale entre les deux pays et la difficulté croissante à conclure des accords avec des entreprises américaines conduit néanmoins la direction à fermer ses bureaux de la Silicon Valley en 2019. Aujourd’hui, Sinovation compte 400 entreprises dans son portefeuille, représentant un total de 3 milliards de dollars d’actifs sous gestion.

Outre ses activités de financement, conscient des apports de Microsoft Research Asia pour la formation et le développement des compétences des futurs ingénieurs, l'homme d'affaires crée en 2016 l’Institut Sinovation Ventures pour l’IA. Celui-ci assure une large diffusion des avancées scientifiques et accélère leur transformation en des applications commercialisables.

Le projet présente un intérêt stratégique majeur pour le développement de l’IA en Chine : il contribue à la formation d’ingénieurs de haut niveau et finance les entreprises que ces professionnels sont susceptibles de lancer.

01.AI, le pari de l’open source

En juin dernier, Kai-Fu Lee a lancé une nouvelle start-up, 01.AI, après avoir levé quelque 200 millions de dollars auprès des BATX, groupe d’entreprises (Baidu, Alibaba, Tencent, Xiamoi) que l’on considère parfois comme des GAFAM chinois. L’objectif était de créer de premières « applications tueuses », c’est-à-dire des applications tellement convaincantes qu’elles sont adoptées par des centaines de millions d’utilisateurs à l’instar de TikTok.

Et les choses n’ont pas trainé ! En janvier, 01.AI a lancé un modèle d’IA « multimodal » surnommé « Yi » fondé sur 34 milliards de paramètres, soit moitié moins que ChatGPT4. Cette taille modeste facilite son entraînement. À travers le monde, de nombreux développeurs, ont déjà adopté Yi.

Le modèle de langage de 01.Ai fait partie des modèles dits open source, comme l’est aussi, par exemple, LlaMA, le langage de Meta. Ils s’opposent aux modèles dits propriétaires dont les fondations techniques ne sont pas partagées. Contrairement à ce que peut laisser entendre son nom, Open IA qui fait tourner ChatGPT fait partie des modèles propriétaires, tout comme les outils développés par Google. Les intérêts associés à l’ouverture sont multiples. Elle facilite l’accès d’un plus grand nombre de chercheurs et d’ingénieurs aux modèles de langage, contribue à une meilleure formation des professionnels et permet de créer un large écosystème de développeurs chargés d’étendre les domaines d’applications de Yi.

Une source d’inspiration ?

La Chine se montre assez peu soucieuse du respect des libertés individuelles. Les lois encadrant le respect de la vie privée sont moins protectrices des individus et il est plus facile en Chine qu’en Occident de construire un ensemble de données suffisamment important pour entraîner un modèle de langage. Ce malgré une loi de type RGPD entrée en vigueur en 2021. Beaucoup d’observateurs attribuent ainsi la compétitivité de Yi à l’ensemble de données sur lequel il a été entraîné. Ce modèle inclut deux fois moins de paramètres que GPT-4 et pourtant les performances des deux modèles sont comparables.

La France, elle, ne manque pas d’atouts sérieux dans l’industrie mondiale de l’IA. L’Hexagone compte, lui aussi, un nombre important de chercheurs et d’ingénieurs IA de tout premier plan. Beaucoup de ces experts sont impliqués dans la création de réseaux neuronaux, de modèles d’apprentissage ou de langage pour Apple, AT&T, IBM, Google ou Meta. Les financeurs également sont au rendez-vous : Xavier Niel, Rodolphe Saadé et Eric Schmidt ont, par exemple, assuré le lancement de Mistral AI et plus récemment, en novembre 2023, du laboratoire non lucratif Kyutai. Ces deux organisations se sont engagées dans la voie de l’open source et Mistral AI propose déjà un modèle très compétitif.

Par ailleurs, ces deux projets disposent des ressources financières nécessaires à leur développement. Kyutai a déjà levé 300 millions d’euros et Mistral AI vient de finir un tour de financement de 385 millions d’euros après avoir levé 105 millions d’euros pour son amorçage. Elle était valorisée à hauteur de 2 milliards de dollars à la fin de l’année dernière. Les ressources financières des deux organisations sont donc, aujourd’hui, supérieures à celles de 01.AI en Chine.

La France ne manque donc ni des compétences ni des sources de financement nécessaires au développement de solutions assurant notre indépendance technologique. Elle ne dispose néanmoins pas (encore ?) d’un écosystème autour des modèles open source de Kyutai et Mistral AI. En Chine, Kai-Fu Lee a adossé un institut de recherche et de formation à une société de capital risque dédiée aux financements de projets IA. Une excellente idée et que nous devrions copier ?