Principales conclusions : cartographie de brevets dans le domaine de l’intelligence artificielle générative

Aperçu des brevets sur l’IA générative à l’échelle mondiale

Key Findings: Patent Landscape Report on Generative Artificial Intelligence

A global patent overview on generative AI
L’IA générative est une technologie de pointe qui est sur le point de bouleverser divers secteurs économiques, sociaux et culturels et qui va bien au-delà de la simple génération de texte à la manière de l’homme dans ChatGPT.  La cartographie de brevets concernant l’IA générative, établie par l’OMPI, s’appuie sur la publication novatrice sur l’intelligence artificielle dans la série de rapports de l’OMPI consacrés aux tendances technologiques et met en lumière l’activité en matière de brevets dans ce domaine d’actualité passionnant, son caractère évolutif et les applications dans lesquelles les technologies de l’IA générative sont appelées à être utilisées.
Les cartographies de brevets présentent la situation des brevets sur une technologie donnée à l’échelle mondiale et peuvent éclairer les discussions de politique générale, la planification de la recherche stratégique ou le transfert de technologie.  La présente cartographie de brevets ne donne pas seulement une vision complète et actualisée du domaine des brevets relatifs à l’intelligence artificielle générative, elle est également assortie d’un aperçu de ses applications futures et de ses répercussions potentielles.  Elle est conçue pour aider les innovateurs, les chercheurs et les organisations à comprendre le domaine de l’intelligence artificielle générative qui évolue rapidement et à saisir les opportunités de collaboration, de partenariat et de croissance.

Nombre d’inventions dans le domaine de l’IA générative dans le monde

L’essor de l’IA générative au cours des dernières années est principalement dû à trois facteurs : des ordinateurs plus puissants, l’existence de vastes ensembles de données comme source de données d’entraînement et l’amélioration des algorithmes d’IA ou d’apprentissage automatique.  Des progrès tels que l’architecture des transformateurs dans les grands modèles de langage ont permis d’accomplir des progrès considérables dans le domaine de l’IA générative.  Cela a permis de mettre au point des applications complexes dans de nombreux domaines.
Les progrès technologiques réalisés dans le domaine de l’IA générative se traduisent par une forte augmentation de l’activité en matière de brevets.  Au cours des 10 dernières années, le nombre de familles de brevets dans le domaine de l’IA générative est passé de seulement 733 en 2014 à plus de 14 000 en 2023. Depuis l’introduction du transformateur en 2017, l’architecture de réseau neuronal profond à l’origine des grands modèles de langage qui sont devenus synonymes d’IA générative, le nombre de brevets dans ce domaine a augmenté de plus de 800%. Le nombre de publications scientifiques a encore augmenté au cours de la même période, passant de 116 en 2014 à plus de 34 000 en 2023. Plus de 25% de l’ensemble des brevets relatifs à l’IA générative et plus de 45% de l’ensemble des documents scientifiques sur ce domaine ont été publiés en 2023.

Quelles sont les organisations qui détiennent le plus grand nombre de brevets relatifs à l’IA générative?

  1. Tencent
  2. Ping An Insurance Group
  3. Baidu
Tencent, Ping An Insurance Group et Baidu détiennent la plupart des brevets relatifs à l’IA générative.  Tencent prévoit d’ajouter des capacités d’IA générative à ses produits, tels que WeChat, afin d’améliorer l’expérience utilisateur.  Ping An se concentre sur les modèles d’IA générative pour la souscription et l’évaluation des risques.  Baidu, l’un des premiers acteurs de l’IA générative, a récemment dévoilé son dernier agent conversationnel (chatbot) géré par l’IA et fondé sur un grand modèle de langage, ERNIE 4.0. L’Académie chinoise des sciences (quatrième) est le seul organisme de recherche à figurer dans les 10 premières places du classement.  Les entreprises chinoises Alibaba (sixième) et Bytedance (neuvième) figurant également dans les 10 premières places.
IBM (cinquième), Alphabet/Google (huitième) et Microsoft (dixième) sont les principales entreprises américaines en termes de brevets relatifs à l’IA générative. IBM a mis au point une plateforme d’IA générative, watsonx, qui permet aux entreprises de déployer et de personnaliser les grands modèles de langage en mettant l’accent sur la conformité et la sécurité des données.  DeepMind, la division IA d’Alphabet/Google, a récemment lancé son dernier grand modèle de langage, Gemini, qui est progressivement intégré dans les produits et services d’Alphabet/Google.  Microsoft est un autre acteur clé de l’IA générative et un investisseur d’OpenAI. OpenAI elle-même n’a déposé que récemment ses premiers brevets relatifs à l’IA générative.  Le conglomérat électronique coréen Samsung Electronics se place aussi parmi les 10 premiers rangs (septième).

Quelles sont les institutions qui ont publié le plus grand nombre de publications scientifiques sur l’IA générative?

L’Académie chinoise des sciences est clairement en tête en termes de publications scientifiques, avec plus de 1100 publications depuis 2010. L’Université de Tsinghua et l’Université de Stanford suivent en deuxième et troisième position avec plus de 600 publications chacune.  Alphabet/Google (quatrième) est la seule entreprise à figurer parmi les 20 premières (556 publications scientifiques).
Cependant, lorsque l’on mesure l’impact des publications scientifiques en fonction du nombre de citations, les entreprises dominent.  Alphabet/Google est de loin la première institution, et sept autres entreprises sont présentes parmi les 20 premières.  L’exemple d’OpenAI est également remarquable.  Dans notre corpus d’IA générative des publications scientifiques, l’entreprise n’a publié que 48 articles (325e institution en termes de nombre de publications), mais ces publications ont totalisé 11 816 citations dans d’autres publications scientifiques (13e institution au total).

Quels sont les pôles d’invention des technologies d’IA générative?

  1. Chine
  2. États-Unis d’Amérique
  3. République de Corée
  4. Japon
  5. Inde
  6. Royaume-Uni
  7. Allemagne
Les inventeurs établis en Chine ont été à l’origine de plus de 38 000 familles de brevets entre 2014 et 2023, d’après les adresses des inventeurs publiées sur les brevets.  Depuis 2017, la Chine publie chaque année plus de brevets dans ce domaine que tous les autres pays réunis.
Avec environ 6300 familles de brevets entre 2014 et 2023, les États-Unis d’Amérique sont le deuxième lieu de recherche le plus important pour la protection par brevet dans le domaine de l’IA générative.  Parmi les pays asiatiques, la République de Corée, le Japon et l’Inde sont d’autres pôles de recherche clés pour l’IA générative, tous classés parmi les cinq principaux pays (respectivement troisième, quatrième et cinquième) à cet égard.  Le Royaume-Uni est le premier site européen (sixième au niveau mondial), avec 714 brevets publiés au cours de cette période.  Mais l’Allemagne suit de près (708 familles de brevets) et a publié plus de brevets relatifs à l’IA générative que le Royaume-Uni au cours des dernières années.
Ces principaux sites d’inventeurs représentent la majorité (94%) de l’activité mondiale en matière de brevets relatifs à l’IA générative.

Quel modèle d’IA générative comptabilise le plus grand nombre de brevets?

Ces dernières années, un certain nombre de programmes ou de modèles d’IA générative ont été mis au point.  Parmi les programmes d’IA générative les plus importants, on peut citer :
  • les réseaux antagonistes génératifs (GAN),
  • les grands modèles de langage fondés sur un décodeur,
  • les auto-encodeurs variationnels,
  • les modèles de diffusion.
Cependant, tous les brevets relatifs à l’IA générative ne peuvent pas être attribués à ces cinq modèles de base spécifiques fondés sur les informations contenues dans les abrégés, les revendications ou les intitulés des brevets.
Dans ces modèles d’IA générative, la plupart des brevets appartiennent aux réseaux antagonistes génératifs (GAN). Entre 2014 et 2023, il y a eu 9700 familles de brevets pour ce type de modèle, dont 2400 familles de brevets publiées pour la seule année 2023. Les auto-encodeurs variationnels et les grands modèles de langage sont les deuxième et troisième modèles les plus importants en termes de brevets, avec respectivement quelque 1800 et 1300 nouvelles familles de brevets entre 2014 et 2023.
En termes de croissance des brevets, ce sont les brevets de réseaux antagonistes génératifs qui ont connu la plus forte progression au cours des 10 dernières années.  Cette évolution a toutefois connu un ralentissement ces derniers temps.  En revanche, les modèles de diffusion et les grands modèles de langage affichent des taux de croissance beaucoup plus élevés au cours des 30 dernières années, le nombre de familles de brevets pour les modèles de diffusion passant de 18 en 2020 à 441 en 2023 et celui des grands modèles de langage de 53 en 2020 à 881 en 2023. L’essor de l’IA générative provoqué par les agents conversationnels modernes tels que ChatGPT a clairement stimulé l’intérêt de la recherche pour les grands modèles de langage.

Quels sont les principaux types de données utilisés dans les brevets relatifs à l’IA générative?

Les principaux types de données d’IA générative sont les suivants :
  • Image
  • Vidéo
  • Texte
  • Parole
  • Son
  • Musique
Parmi les différents modes d’IA générative ou les types d’entrée et de sortie de données, la plupart des brevets appartiennent à la catégorie des images/vidéos.  Les données image/vidéo sont particulièrement importantes pour les GAN.  Les brevets portant sur le traitement du texte et de la parole/du son/de la musique sont des types de données clés pour les grands modèles de données.  Les autres modes – les modèles d’images en 3D, les molécules/gènes/protéines chimiques et les codes/logiciels – ont jusqu’à présent donné lieu à beaucoup moins de brevets.  Comme pour les brevets liés aux modèles de base de l’IA générative, certains brevets ne peuvent pas être clairement attribués à un type de données spécifique.  En outre, certains brevets correspondent à plus d’un mode parce que certains modèles d’IA générative, comme les grands modèles de langage multimodaux, surmontent la limitation de l’utilisation d’un seul type d’entrée ou de sortie de données.

Principaux domaines couverts par les brevets relatifs à l’IA générative

Il existe des domaines clés pour les brevets relatifs à l’IA générative, notamment :
  • les logiciels,
  • les sciences de la vie,
  • la gestion des documents,
  • les solutions d’entreprise,
  • la fabrication,
  • le transport,
  • la sécurité,
  • les télécommunications.
L’IA générative devrait avoir un impact significatif sur de nombreux secteurs à mesure qu’elle trouve sa place dans les produits, les services et les processus, devenant un catalyseur technologique pour la création de contenu et l’amélioration de la productivité.
Par exemple, il existe de nombreux brevets relatifs à l’IA générative dans le domaine des sciences de la vie (5346 familles de brevets entre 2014 et 2023) et dans la gestion et l’édition de documents (4976). Les autres applications notables pour lesquelles le nombre de brevets relatifs à l’IA générative est passé d’environ 2000 à environ 5000 au cours de la même période sont les solutions d’entreprise, l’industrie et la fabrication, le transport, la sécurité et les télécommunications.
Dans le secteur des sciences de la vie, l’IA générative peut accélérer la mise au point de médicaments en sélectionnant et en créant des molécules pour de nouvelles formulations de médicaments et pour la médecine spécialisée.  Dans le domaine de la gestion et de la publication de documents, l’IA générative peut automatiser des tâches, permettre des économies de temps et d’argent et créer des supports de marketing sur mesure.  Dans les solutions d’entreprise, l’IA générative peut être utilisée pour les agents conversationnels du service clientèle, les systèmes d’aide à la vente au détail et la récupération des connaissances des employés.  Dans l’industrie et la fabrication, l’IA générative permet de nouvelles fonctions telles que l’optimisation de la conception des produits et la programmation de jumeaux numériques.  Dans le secteur du transport, l’IA générative joue un rôle crucial dans les véhicules autonomes et l’optimisation des transports publics.
L’IA générative peut contribuer à la conception de nouvelles molécules, accélérant ainsi la mise au point de médicaments.  Elle peut automatiser les tâches relatives à la gestion et à l’édition de documents, dans le domaine de la vente au détail et des agents conversationnels utilisés pour les services à la clientèle dans les entreprises et favoriser la conception et l’amélioration de produits, y compris dans les systèmes de transports en commun et les véhicules autonomes.