Si vous avez raté notre table ronde sur l'IA générative open source, lisez cette newsletter.
Afficher dans le navigateur
logo_INProg_focus

Le 18 juin 2024

Mardi dernier, nous organisions nos Rencontres Estivales au MK2 Bibliothèque, auxquelles nous avions convié plusieurs experts de l’intelligence artificielle générative (IAG) pour venir débattre des différents modèles en place. Alors, la bataille de l’open source VS code fermé est-elle vraiment la bonne question à se poser ? Réponse avec Patrick Perez, CEO de Kyutai, Ons Jelassi, Directrice Executive Education à Télécom Paris, Alexandre Zapolsky, Président de Linagora, et Guillaume Avrin, Coordonnateur national de la stratégie d’intelligence artificielle du Gouvernement.

points-Jun-17-2024-02-31-33-6856-PM

IA générative : la cohabitation des modèles, une formule gagnante ?

une34b

L’IA générative open source, une définition encore balbutiante

Tous sont unanimes : avant même de pouvoir débattre autour des questions de modèles, il s’agirait de pouvoir définir clairement ce que l’on entend par IAG open source. Pour Alexandre Zapolsky, Président de Linagora, éditeur français de logiciels libres, “il y a aujourd’hui beaucoup d’open source washing, tout le monde a compris quand on mettait le mot open source sur le bidon d’IA, cela permettait de mieux vendre. Chez Linagora, nous avons une définition assez rigoriste : une IA réellement open source, c’est une IA qui n’a aucune restriction d’usage, dont les méthodes d'entraînement sont publiques et partagées, et pour laquelle il faut fournir les data sets qui ont permis l'entraînement de l’IA fondation”.

Et si on respecte ces trois critères, on se rend compte que beaucoup d’IA dites open source ne le sont pas. Définir l’IAG open source, c’est donc possible, faut-il encore tous se mettre d’accord ! C’est en tout cas la volonté de plusieurs initiatives citées lors de la table ronde, comme la communauté Open LLM France ou l’Open Source Initiative, qui vient tout juste d’annoncer une feuille de route sur la question, avec pour objectif la publication d’une définition officielle en octobre prochain.

L’ouverture des modèles, une nécessité scientifique et humaine

En attendant, toute ouverture est bonne à prendre ! C’est en tout cas ce que défendent Patrick Perez, CEO de Kyutai, et Ons Jelassi, Directrice Executive Education de Télécom Paris. “C’est indispensable que la science soit ouverte pour qu’elle progresse et que les bénéfices soient partagés. C’est donc primordial d’avoir des IA de plus en plus ouvertes, jusqu’à de l’open source complet. Cela permet d’offrir à la communauté scientifique, aux développeurs et aux décideurs, un accès aux modèles pour une meilleure compréhension et une meilleure sécurité” précise Patrick Perez. C’est d’ailleurs pour ces mêmes raisons que le chercheur rappelle l’importance des modèles semi-ouverts, notamment ceux développés par des sociétés américaines, car “avoir ces objets-là ouverts, et pouvoir travailler dessus, les spécialiser, les inspecter, c’est déjà une valeur considérable pour l’écosystème”. 

Même son de cloche du côté académique : “il y a autant d’importance à ouvrir l’algorithme de l’IA que d’ouvrir les données d’apprentissage pour bien comprendre comment le modèle a appris et quel poids a été donné aux données pour avoir tels ou tels résultats”, précise Ons Jelassi. Pour la scientifique, il y a plusieurs bénéfices à cette ouverture des modèles : la multiplication des collaborations entre le monde de la recherche et celui de l’innovation, le renforcement de la formation des étudiants et une meilleure attractivité économique, qui favorise généralement les financements de projets de R&D. 

small1

Quid du rôle de l’Etat ?

Guillaume Avrin le rappelle : le titre de la phase 2 de la stratégie nationale pour l'IA (qu’il coordonne), c’est “Diffuser des technologies d’intelligence artificielle au sein de l’économie”. Pour lui, l’ouverture des modèles, quel que soit le niveau d’ouverture, contribue très largement à cette ambition : “l’open source est un levier que l’on active sur plusieurs de nos projets, c’est un catalyseur de la diffusion de l’IA dans notre économie”. Trois exemples à l’appui :

  • le financement de la mission P16, issue d’un projet confié à Inria par le secrétariat général pour l’investissement dans le cadre de France 2030, autour de la spin off Probabl, qui propose des solutions et des services basés sur la bibliothèque open-source d’apprentissage statistique en Python “scikit-learn”, l’une des plus utilisées aujourd’hui à travers le monde ;
  • l’initiative DeepGreen, qui vise à réunir des partenaires français majeurs de la recherche et de l’industrie, afin de développer une plateforme logicielle dédiée à l’IA embarquée ;
  • l’appel à projets sur les communs numériques de l’IAG (dont les 7 lauréats ont été récemment annoncés), pour construire sur l’ensemble de la chaîne de valeur de l’IA générative, “ce que l’on pourrait appeler les autoroutes de l’IAG, toutes ces infrastructures essentielles pour construire des produits et services de l’IAG”.

Pour le représentant de l’Etat, il n’y a pas de secret : “nous ne pouvons pas y arriver si nous n’activons pas l’écosystème open source français et européen dans son ensemble”. 

La cohabitation des modèles, une formule gagnante pour la souveraineté numérique ?

Et qui dit écosystème dit diversité d’acteurs et de modèles. Alexandre Zapolsky évoque d’ailleurs la notion de “diversité numérique” et fait un parallèle intéressant avec la biodiversité. Pour lui, “il est idiot de vouloir faire un Google européen, ce n’est pas le sujet”. L’enjeu, c’est de trouver le bon équilibre entre le fermé et l’ouvert, car “les deux modèles doivent se nourrir l’un l’autre. Au-delà de l’open source, nous avons aussi besoin de modèles propriétaires faciles à utiliser, notamment pour le grand public. Sans ChatGPT, nous serions toujours sur des modèles open source réservés aux experts” rappelle Ons Jelassi. L'opposition des modèles n'a pas lieu d'être, "il n'y a pas les modèles propriétaires pour faire de l'argent et les modèles open source pour le monde de la recherche" précise Alexandre Zapolsky. 

En synthèse : sur ce sujet comme ailleurs... point de manichéisme. Ce qui semble primordial, en revanche, c'est de jouer collectif. De travailler en bonne intelligence entre acteurs de la recherche et entreprises innovantes. En misant tantôt sur des modèles open source, tantôt sur des systèmes propriétaires... et en hybridant souvent les deux ! 

Et pour tout vous dire, cette promesse de l'innovation collective est loin d'être un vœu pieu. A l'heure où nous écrivons ces lignes, pas moins de 15 expert.es Cap Digital sont réunis en jury de labellisation et auditionnent jusqu'à ce soir les 20+ projets collaboratifs portés par nos adhérents dans le cadre de l'appel "Accélérer l'usage de l'intelligence artificielle générative dans l'économie". CQFD. 

on_y_etait3
points-Jun-17-2024-02-31-33-6856-PM
Capture décran 2024-02-13 143954

In Progress, la newsletter qui reconnecte l'innovation au progrès
Une infolettre préparée avec amour par les équipes de Cap Digital.

Elle vous a plu ? Nous vous invitons à consulter nos archives, vous abonner ou nous contacter
Sinon, vous pouvez aussi vous désinscrire, on ne le prendra pas mal.

www.capdigital.com

LinkedIn
X
YouTube

L'action de Cap Digital est soutenue par

InProgress_financeurs23_transparent-1

Cap Digital, 14, rue Alexandre Parodi, 75010 Paris, France

Gérer les préférences