Por Kathy Van Der Herten, directora de Gestión de Productos de la CAS, una división de la American Chemical Society, Amberes (Bélgica)
La inversión en investigación y desarrollo (I+D) se encuentra en su punto más álgido. Según las estimaciones, la inversión mundial en I+D alcanzó los 2476 billones de dólares de los EE. UU. en 2022, lo que impulsó el vigoroso y sostenido crecimiento del número de solicitudes de patente, con el consiguiente incremento de la presión sobre el ecosistema mundial de patentes y, en particular, sobre las oficinas de patentes. El aumento del volumen y la complejidad de las solicitudes de patente puede ocasionar notables demoras en su concesión, lo que redunda en inseguridad jurídica, que a su vez puede socavar el espíritu innovador, desalentar la inversión en I+D y erosionar la competitividad de las economías nacionales.
En un estudio efectuado en 2018 , la Oficina Japonesa de Patentes estimó que sus examinadores dedicaban el 30% del tiempo a la búsqueda del estado de la técnica (pruebas de que la invención ya es conocida) y otro 10% a su comprensión.
Uno de los métodos que utilizan las oficinas de patentes para agilizar la tramitación de las solicitudes es el empleo de soluciones de inteligencia artificial (IA) para identificar publicaciones que podrían formar parte del estado de la técnica. La IA tiene la capacidad de imitar, a gran velocidad, la destreza humana de comparar datos entre solicitudes de patente y publicaciones relacionadas y no relacionadas con patentes al objeto de detectar similitudes susceptibles de análisis por parte de los examinadores que investigan el estado de la técnica. Si bien este sistema no suple la revisión de los resultados de la búsqueda a cargo de examinadores de carne y hueso, puede agilizar, en gran medida, el proceso en más del 70% de las solicitudes.
La IA tiene la capacidad de imitar, a gran velocidad, la destreza humana de comparar datos entre solicitudes de patente y publicaciones relacionadas y no relacionadas con patentes al objeto de detectar similitudes susceptibles de análisis por parte de los examinadores…
Según datos de la OMPI, la CAS, una división de la American Chemical Society, calcula que, entre 2012 y 2021, la tasa compuesta de crecimiento anual de las solicitudes de patente en las cinco principales oficinas de patentes fue del 4,4%. Al aumento del número de solicitudes se añade la creciente complejidad de las patentes, conforme se refleja en la cantidad de reivindicaciones por solicitud de patente, de patentes citadas por reivindicación o de citas del estado de la técnica por patente, entre otros indicadores.
La búsqueda del estado de la técnica es un proceso complicado, iterativo y que lleva mucho tiempo. Para cada solicitud, los responsables de la búsqueda y el examen deben idear una estrategia de búsqueda, seleccionar las bases de datos que vayan a utilizar, efectuar la búsqueda, evaluar los resultados y, si fuera menester, afinar y repetir la búsqueda con parámetros diferentes.
La magnitud de estas búsquedas resulta abrumadora. Según un estudio de la Oficina Europea de Patentes , una búsqueda exhaustiva de solicitudes de patente puede sustentarse en una búsqueda del estado de la técnica de unos 1300 millones de registros técnicos en 179 bases de datos, de manera que cada mes aparecen unos 600 millones de documentos en los resultados de la búsqueda.
Una búsqueda del estado de la técnica de unos 1300 millones de registros técnicos en 179 bases de datos equivale a la aparición mensual de unos 600 millones de documentos en los resultados de la búsqueda.
El auge de las nuevas tecnologías y la complejidad de las solicitudes de patente obligan a los examinadores a una actualización constante de sus conocimientos en su ámbito de la técnica. La IA, si se nutre de datos muy depurados y estructurados, puede acelerar el proceso gracias a la criba de millones de conjuntos de datos y a la aportación de referencias susceptibles de entrar en conflicto con la solicitud en cuestión.
Varias oficinas de patentes han recurrido a soluciones basadas en la IA para hacer frente al creciente volumen y a la mayor complejidad de las solicitudes de patente. Según la OMPI, hay más de 70 iniciativas relacionadas con la IA en marcha en 27 oficinas nacionales de patentes, entre ellas 13 centradas en la búsqueda del estado de la técnica. Si bien no se trata de soluciones integrales para un proceso de examen cabal, sí tienen por objeto acelerar los plazos de examen, lo que redunda en una mayor pertinencia temporal y, en última instancia, en la satisfacción del cliente.
Por ejemplo, la Oficina Canadiense de Propiedad Intelectual utiliza motores de búsqueda basados en la IA disponibles en el mercado para detectar los vínculos entre las citas, las solicitudes y el estado actual de la técnica. La Oficina Japonesa de Patentes (JPO) recurre a la IA para la indexación de archivos y, con este fin, sugiere clasificaciones de patentes y palabras clave pertinentes y organiza los documentos de patentes relativos al estado anterior de la técnica en función de su relevancia. Por su parte, la Oficina de Patentes y Marcas de los Estados Unidos de América (USPTO) se sirve de la IA como respaldo para determinar la patentabilidad, analizar el historial de tramitación y mejorar el acceso público a los datos de la USPTO.
El aprendizaje automático resulta eficaz para la búsqueda de texto y términos indexados, pero no tanto para las patentes relacionadas con la composición de materia, que suelen contener datos esenciales en el interior de las estructuras.
No hace mucho, el Instituto Nacional de la Propriedad Industrial (INPI) del Brasil colaboró con la CAS en la ejecución de un proyecto de optimización del flujo de trabajo mediante IA para agilizar las búsquedas del estado de la técnica en el ámbito de la química. Las solicitudes del ámbito de la química, que representaron aproximadamente el 15% de los retrasos en la tramitación de las solicitudes del INPI del Brasil, revisten una enorme complejidad y exigen la ejecución de búsquedas tanto por texto como por estructura tanto en las publicaciones de patentes como en las que no están relacionadas con las patentes. El componente de IA de la solución integraba cuatro flujos de algoritmos que llevaban a cabo distintos tipos de análisis de similitud y de otra índole con miras a la obtención de resultados de la máxima pertinencia.
Cada algoritmo tiene sus puntos fuertes. El aprendizaje automático resulta eficaz para la búsqueda de texto y términos indexados, pero no tanto para las patentes relacionadas con la composición de materia (en las que se mezclan dos o más compuestos), que suelen contener datos esenciales en el interior de las estructuras. Del mismo modo, una base de datos gráfica puede hallar similitudes y conexiones que el aprendizaje automático no es capaz de detectar. A continuación, un algoritmo de conjunto analizó los resultados de los cuatro flujos y generó una única lista de las publicaciones con mayor probabilidad de entrar en conflicto con la solicitud en cuestión.
Los efectos beneficiosos sobre la productividad fueron considerables:
La calidad de los datos es fundamental para entrenar algoritmos de IA. Cuantos más datos se incorporen a los algoritmos de aprendizaje automático, más pertinentes, fiables y de confianza serán sus resultados. Buena parte de los datos no procesados que se encuentran accesibles al público pueden incluir errores de transcripción, unidades mal etiquetadas y una terminología de patentes demasiado compleja, todos ellos factores que entorpecen las búsquedas. En particular, esto plantea un problema en los ámbitos de la química y las ciencias de la vida, en los que las sustancias aparecen descritas sin coherencia en las distintas publicaciones o contienen palabras clave incrustadas en tablas o imágenes. La utilización de datos recopilados por científicos que se han sometido a un proceso de normalización, preparación y conexión en un formato estructurado facilita la búsqueda de información y mejora el entrenamiento de los algoritmos de IA y el rendimiento de las búsquedas del estado de la técnica.
Aunque el entrenamiento de los conjuntos puede diferir entre tecnologías, sectores y solicitudes, el planteamiento fundamental para la aplicación de la IA no varía.
Para el proyecto del INPI del Brasil, confiamos en buena parte en la CAS Content Collection™, la recopilación más grande del mundo de datos sobre química y ciencias de la vida, que se extrae, indexa y enlaza al objeto de simplificar el acceso y la recuperación de la información pertinente. Además, retuvimos una muestra aleatoria de patentes obtenidas a partir del entrenamiento del algoritmo, que utilizamos como conjunto de control para medir la precisión de los resultados y los porcentajes de acierto. Estas patentes fueron evaluadas por examinadores de oficinas de patentes de China, el Japón, los Estados Unidos de América y Europa, y su pertinencia fue validada por nuestro propio equipo de profesionales de la búsqueda en el ámbito de la PI.
Aunque el entrenamiento de los conjuntos puede diferir entre tecnologías, sectores y solicitudes, el planteamiento fundamental para la aplicación de la IA no varía. Para cualquier área tecnológica, las citas susceptibles de entrar en conflicto que se utilizan se identifican durante el proceso de examen para cada conjunto de entrenamiento. Las tecnologías de gran complejidad, como la química, pueden obtener mejores resultados con un conjunto de entrenamiento sobre un tema específico, pero es posible que otras tecnologías no presenten mejoras significativas con el uso de conjuntos de entrenamiento específicos. En muchas esferas, con tal de que la tecnología esté representada en un conjunto general de entrenamiento, los modelos dan buen resultado.
En cualquier caso, la calidad de los datos reviste suma importancia.
Los equipos de proyectos de IA precisan un vasto abanico de conocimientos específicos en la materia. El proyecto del INPI del Brasil conjugó la tecnología con especialistas en análisis de datos, integración de flujos de trabajo, computación de alto rendimiento, búsquedas científicas y muchas otras disciplinas.
Los miembros de los equipos deben poseer conocimientos en distintos ámbitos sobre los desafíos a los que se enfrentan y los resultados que persiguen. Por ejemplo, una persona con experiencia en ciencia de datos tal vez no pueda crear algoritmos de total eficacia si no comprende los matices de las estructuras químicas. Los científicos computacionales que diseñan modelos de aprendizaje automático también deben comprender los datos y las estructuras de la química.
La integración de los flujos de trabajo es otra disciplina esencial a la hora de crear una solución integral para las oficinas de patentes. Los examinadores que tienen que explorar múltiples sistemas y carpetas para encontrar documentos durante un examen pueden sacar provecho de las mejoras del flujo de trabajo y de las innovaciones tecnológicas que permiten disponer de un único tablero de control desde el que pueden acceder a todas las solicitudes y la documentación justificativa y analizarlas, y en el que pueden comprobar los motivos de la devolución de determinados documentos de referencia y el modo de generación de los resultados; todo ello les proporciona la trazabilidad necesaria para fundamentar sus decisiones a efectos de la tramitación y de los controles de calidad internos.
Es perfectamente factible lograr mejoras drásticas en la productividad, la eficiencia y el servicio al cliente de las oficinas de patentes mediante la utilización por parte de los examinadores de herramientas basadas en las últimas tecnologías, como la IA. La creciente innovación traerá consigo un aumento del volumen y la complejidad de las solicitudes de patente. Así pues, las oficinas de patentes cada vez más precisarán de nuevos métodos que les permitan optimizar el proceso de examen de las solicitudes y colmar con ello las expectativas de un mayor grado de satisfacción con el servicio que tienen las partes interesadas.
Si bien las soluciones de IA pueden contribuir a abordar estos desafíos en constante evolución, no dejarán de hacer falta conocimientos especializados para poner en práctica planteamientos adaptados a cada ámbito y oficina. Habida cuenta de que cada oficina de patentes tiene unas necesidades concretas, un planteamiento único no servirá. Aunque las oficinas de patentes llevan a cabo las mismas actividades generales, difieren en cuanto a dotación de personal y tecnología necesaria para respaldar cada ámbito. Aunque los algoritmos pueden resolver una necesidad común, la interacción de los examinadores con los resultados puede ser muy diferente en función del entorno tecnológico vigente.
Es perfectamente factible lograr mejoras drásticas en la productividad, la eficiencia y el servicio al cliente de las oficinas de patentes mediante la utilización por parte de los examinadores de herramientas basadas en las últimas tecnologías, como la IA.
Las oficinas de patentes que deseen lograr sus resultados estratégicos habrán de recurrir a innovaciones personalizadas que satisfagan las expectativas de las partes interesadas con independencia de las limitaciones de recursos. La combinación adecuada de datos, tecnología y conocimientos humanos puede brindar la flexibilidad necesaria para introducir mejoras sostenibles de cara al futuro.
Para saber más sobre las posibilidades que ofrece la IA para mejorar la productividad del sistema mundial de patentes, consulte el libro blanco de la CAS titulado “Sustainability of the Global Patent System: the role of AI in enhancing productivity” (Sostenibilidad del sistema mundial de patentes: el papel de la IA en la mejora de la productividad).
Agradecimientos: Matthew Bryan y Andras Jokuti, Sector de Patentes y Tecnología, OMPI
Bruno Poulequen, Ulrike Till y Young-Woo Yun, Sector de Infraestructura y Plataformas, OMPI
Editado por: Catherine Jewell
El propósito de OMPI Revista es fomentar los conocimientos del público respecto de la propiedad intelectual y la labor que realiza la OMPI, y no constituye un documento oficial de la Organización. Las denominaciones empleadas en esta publicación y la forma en que aparecen presentados los datos que contiene no entrañan, de parte de la OMPI, juicio alguno sobre la condición jurídica de ninguno de los países, territorios o zonas citados o de sus autoridades, ni respecto de la delimitación de sus fronteras o límites. La presente publicación no refleja el punto de vista de los Estados miembros ni el de la Secretaría de la OMPI. Cualquier mención de empresas o productos concretos no implica en ningún caso que la OMPI los apruebe o recomiende con respecto a otros de naturaleza similar que no se mencionen.