Kathy Van Der Herten, directrice de la gestion des produits, CAS, une division de l’American Chemical Society, Anvers (Belgique)
Les investissements dans la recherche-développement ont atteint un niveau sans précédent. On estime que, à l’échelle mondiale, ils ont atteint 2476 milliards de dollars É.-U. en 2022, à l’origine de la forte croissance continue du nombre de demandes de brevet qui met à rude épreuve l’écosystème mondial des brevets, et en particulier les offices. L’augmentation tant du volume que de la complexité des demandes peut entraîner des retards importants dans la délivrance des brevets, ce qui engendre une insécurité juridique susceptible de freiner l’innovation, de décourager les investissements dans la recherche-développement et d’éroder la compétitivité des économies nationales.
Il ressort d’une étude réalisée en 2018 par l’Office des brevets du Japon , que les examinateurs de cet office consacraient 30% de leur temps à la recherche sur l’état de la technique (preuve que l’invention est déjà connue) et 10% à le comprendre.
L’une des méthodes que les offices de brevets ont adoptées pour améliorer les délais de traitement consiste à utiliser des solutions fondées sur l’intelligence artificielle afin de mettre en évidence les éléments susceptibles de faire partie de l’état de la technique au cours de l’examen. L’intelligence artificielle peut imiter, à un rythme rapide, la capacité qu’ont les êtres humains de comparer des données figurant dans les demandes de brevet, les brevets existants et la littérature non-brevet pour faire ressortir des similitudes que les examinateurs peuvent étudier dans le cadre de la recherche sur l’état de la technique. Si cette méthode ne se substitue pas à l’examen des résultats de la recherche par les examinateurs, elle peut permettre d’accélérer considérablement l’examen dans plus de 70% des demandes.
L’intelligence artificielle peut imiter, à un rythme rapide, la capacité qu’ont les êtres humains de comparer des données figurant dans les demandes de brevet, les brevets existants et la littérature non-brevet pour faire ressortir des similitudes que les examinateurs peuvent étudier…
En se fondant sur les données de l’OMPI, le CAS, une division de l’American Chemical Society, a estimé que, au sein des cinq principaux offices de brevets, le taux de croissance annuel composé des demandes de brevet a augmenté de 4,4% entre 2012 et 2021. À l’augmentation du nombre de demandes s’ajoute celle de leur complexité, comme en témoigne le nombre de revendications par brevet, de citations de brevets par revendication, de citations de l’état de la technique par brevet et d’autres mesures.
La recherche sur l’état de la technique est un processus compliqué, itératif et chronophage. Pour chaque demande, les chercheurs et les examinateurs doivent mettre au point une stratégie de recherche, choisir les bases de données à utiliser, effectuer la recherche, évaluer les résultats et, au besoin, affiner et effectuer la recherche une nouvelle fois en appliquant des paramètres différents.
L’ampleur de ces recherches est stupéfiante. Selon une étude de l’Office européen des brevets , une recherche exhaustive en matière de brevets peut reposer sur une recherche sur l’état de la technique couvrant environ 1,3 milliard de documents techniques issus de 179 bases de données; ce sont ainsi quelque 600 millions de documents qui apparaissent chaque mois dans les résultats de recherche.
Une recherche sur l’état de la technique couvrant environ 1,3 milliard de documents techniques issus de 179 bases de données; ce sont ainsi quelque 600 millions de documents qui apparaissent chaque mois dans les résultats de recherche.
Du fait de l’essor des nouvelles technologies et de l’augmentation de la complexité des demandes de brevet, les examinateurs doivent sans cesse renforcer leur niveau de compétence dans leur domaine. Si elle est alimentée par des données soigneusement sélectionnées et structurées, l’intelligence artificielle peut accélérer le processus en passant au crible des millions de jeux de données et en faisant ressortir les sources susceptibles d’entrer en conflit avec la demande examinée.
Un certain nombre d’offices de brevets se tournent vers des solutions fondées sur l’intelligence artificielle pour mieux faire face à l’augmentation du volume et de la complexité des demandes de brevet. D’après l’OMPI, plus de 70 initiatives liées à l’intelligence artificielle sont en cours dans 27 offices de brevets nationaux, dont 13 sont axées sur la recherche sur l’état de la technique. Bien que les solutions en question ne couvrent pas le processus d’examen dans son intégralité, elles visent à en accélérer la durée, ce qui améliore le respect des délais et, à terme, la satisfaction des clients.
Ainsi, l’Office de la propriété intellectuelle du Canada utilise des moteurs de recherche fondés sur l’intelligence artificielle disponibles sur le marché pour mettre en évidence les liens entre les citations, les demandes et l’état de la technique. L’Office des brevets du Japon (JPO) a recours à I’intelligence artificielle pour indexer des fichiers, proposer des classifications de brevets et des mots-clés pertinents et classer les documents de brevet relevant de l’état de la technique en fonction de leur pertinence. Quant à l’Office des brevets et des marques des États-Unis d’Amérique, il l’utilise pour déterminer la brevetabilité, analyser l’historique de l’instruction de la demande de brevet et faciliter l’accès du public à ses données.
L’apprentissage automatique est efficace pour la recherche de texte et de termes indexés, mais l’est moins pour les brevets portant sur la composition de matières, qui contiennent souvent des données importantes figurant dans des structures.
Récemment, l’Institut national de la propriété industrielle (INPI) du Brésil a collaboré avec le CAS pour mener à bien un projet utilisant l’optimisation du flux de travail par l’intelligence artificielle pour accélérer les recherches sur l’état de la technique dans le domaine de la chimie. Les demandes relevant de ce domaine, qui représentaient environ 15% des demandes en retard au sein de l’INPI du Brésil, sont extrêmement complexes et requièrent des recherches à la fois textuelles et structurelles dans des documents de brevet et la littérature non-brevet. La composante de la solution fondée sur l’intelligence artificielle intégrait quatre flux d’algorithmes qui effectuaient différents types d’analyses de similitudes, entre autres analyses, pour garantir la pertinence des résultats.
Chaque algorithme a ses points forts. L’apprentissage automatique est efficace pour la recherche de texte et de termes indexés, mais l’est moins pour les brevets portant sur la composition de matières (lorsque deux composés ou plus sont mélangés), qui contiennent souvent des données importantes figurant dans des structures. De même, une base de données graphique peut faire ressortir des similitudes et des liens que l’apprentissage automatique ne peut pas trouver. Un algorithme d’ensemble a ensuite analysé les résultats auxquels les quatre flux étaient parvenus et a établi une liste des publications les plus susceptibles d’entrer en conflit avec la demande examinée.
Les avantages sur le plan de la productivité ont été considérables :
La qualité des données est essentielle pour l’entraînement des algorithmes d’intelligence artificielle. Plus les algorithmes d’apprentissage automatique ont accès à des données, plus leurs résultats sont pertinents et fiables. De nombreuses données non archivées accessibles au public peuvent comporter des erreurs de transcription, des unités non normalisées et une terminologie propre aux brevets trop complexe, autant d’éléments qui entravent les recherches. Ce problème se pose tout particulièrement dans le domaine de la chimie et des sciences de la vie, lorsque la description des substances n’est pas harmonisée dans l’ensemble des publications ou lorsque des mots-clés sont intégrés dans des tableaux ou des images. L’utilisation de données scientifiques normalisées, préparées et connectées dans un format structuré facilite la recherche d’informations et améliore l’entraînement des algorithmes d’intelligence artificielle et les résultats des recherches sur l’état de la technique.
Si l’entraînement des ensembles peut varier selon les technologies, les secteurs et les demandes, l’approche fondamentale de l’application de l’intelligence artificielle demeure la même.
Pour le projet de l’INPI du Brésil, nous nous sommes appuyés en grande partie sur la CAS Content Collection, la plus grande collection de données sur la chimie et les sciences de la vie au monde, qui est extraite, indexée et liée pour faciliter la recherche d’informations pertinentes et l’accès à ces informations. En outre, nous avons conservé un échantillon aléatoire de brevets issus de l’entraînement des algorithmes, que nous avons utilisé comme ensemble de contrôle pour mesurer la précision des résultats et les taux de réussite. Ces brevets ont été évalués par des examinateurs des offices de brevets en Chine, au Japon, aux États-Unis d’Amérique et en Europe, et leur pertinence a été validée par notre équipe interne de spécialistes de la recherche en matière de propriété intellectuelle.
Si l’entraînement des ensembles peut varier selon les technologies, les secteurs et les demandes, l’approche fondamentale de l’application de l’intelligence artificielle demeure la même. Pour tout domaine technologique, les citations litigieuses utilisées sont identifiées au cours du processus d’examen pour chaque ensemble d’entraînement. Dans les domaines très complexes, comme celui de la chimie, on peut obtenir de meilleurs résultats avec un ensemble d’entraînement propre à un sujet, mais dans d’autres domaines, l’utilisation d’ensembles d’entraînement ciblés peut ne pas apporter d’amélioration significative. Dans de nombreux domaines, tant que la technologie est représentée dans un ensemble d’entraînement général, les modèles sont performants.
Néanmoins, la qualité des données revêt une grande importance.
Les équipes chargées des projets relatifs à l’intelligence artificielle doivent posséder des compétences très diverses en la matière. Le projet de l’INPI du Brésil a fait appel à la technologie et à des spécialistes de l’analyse de données, de l’intégration des flux de travail, du calcul à haute performance, de la recherche scientifique et de nombreuses autres disciplines.
Les membres de l’équipe doivent posséder une expertise pluridisciplinaire des défis et des résultats examinés. Par exemple, il se peut qu’une personne possédant une expérience en science des données ne soit pas en mesure de développer des algorithmes pleinement efficaces si elle ne comprend pas les nuances des structures chimiques. Les informaticiens qui créent des modèles d’apprentissage automatique doivent également comprendre les données et les structures chimiques.
L’intégration du flux de travail est un autre aspect important de la création d’une solution complète pour les offices de brevets. Les examinateurs qui doivent parcourir de nombreux systèmes et dossiers pour trouver des documents au cours de l’examen peuvent bénéficier d’améliorations du flux de travail et d’améliorations technologiques qui aboutissent à un tableau de bord unique où toutes les demandes et tous les documents justificatifs peuvent être consultés et analysés, et où ils peuvent voir pourquoi certains documents de référence sont renvoyés et comment les résultats sont générés, fournissant la traçabilité dont ils ont besoin pour étayer les décisions pour l’instruction des demandes et les évaluations internes de la qualité.
Des améliorations spectaculaires de la productivité, de l’efficacité et du service à la clientèle des offices de brevets sont possibles lorsque les examinateurs peuvent manier des outils conçus autour des dernières technologies, comme l’intelligence artificielle. L’innovation s’accélère, tout comme l’augmentation du volume et de la complexité des demandes de brevet. Ainsi, les offices continueront d’avoir besoin de nouvelles méthodes pour optimiser le processus d’examen des demandes de brevet et répondre ainsi aux attentes des parties prenantes, qui souhaitent des niveaux de satisfaction plus élevés à l’égard des services offerts.
Si les solutions fondées sur l’intelligence artificielle peuvent permettre de relever ces défis en constante évolution, elles nécessiteront néanmoins des compétences pour mettre en œuvre des approches adaptées. Une approche unique ne fonctionnera pas, car les offices de brevets n’ont pas tous les mêmes besoins. S’ils mènent les mêmes activités de manière générale, les offices ne disposent pas tous du même effectif ni des mêmes technologies pour répondre aux besoins de chaque domaine. Les algorithmes peuvent certes répondre à un besoin commun, mais la façon dont les examinateurs utilisent les résultats peut varier grandement selon l’environnement technologique existant.
Des améliorations spectaculaires de la productivité, de l’efficacité et du service client des offices de brevets sont possibles lorsque les examinateurs peuvent manier des outils conçus autour des dernières technologies, comme l’intelligence artificielle.
Les offices de brevets qui cherchent à atteindre leurs résultats stratégiques auront besoin d’innovations personnalisées qui répondent aux attentes des parties prenantes malgré les contraintes de ressources. En associant judicieusement les données, la technologie et les compétences humaines, on peut obtenir la souplesse nécessaire pour obtenir des améliorations durables à l’avenir.
Pour en savoir plus sur la manière dont l’intelligence artificielle peut améliorer la productivité du système mondial des brevets, consultez le livre blanc du CAS intitulé “Sustainability of the Global Patent System: the role of AI in enhancing productivity”.
Remerciements : Matthew Bryan et Andras Jokuti, Secteur des brevets et de la technologie, OMPI
Bruno Pouliquen, Ulrike Till et Young-Woo Yun, Secteur de l’infrastructure et des plateformes, OMPI
Édité par : Catherine Jewell
Le Magazine de l’OMPI vise à faciliter la compréhension de la propriété intellectuelle et de l’action de l’OMPI parmi le grand public et n’est pas un document officiel de l’OMPI. Les désignations employées et la présentation des données qui figurent dans cette publication n’impliquent de la part de l’OMPI aucune prise de position quant au statut juridique des pays, territoires ou zones concernés ou de leurs autorités, ni quant au tracé de leurs frontières ou limites territoriales. Les opinions exprimées dans cette publication ne reflètent pas nécessairement celles des États membres ou du Secrétariat de l’OMPI. La mention d’entreprises particulières ou de produits de certains fabricants n’implique pas que l’OMPI les approuve ou les recommande de préférence à d’autres entreprises ou produits analogues qui ne sont pas mentionnés.