Кэти Ван Дер Хертен, директор по управлению продуктами, CAS, подразделение Американского химического общества, Антверпен, Бельгия
Инвестиции в научно-исследовательскую и опытно-конструкторскую деятельность (НИОКР) находятся на рекордно высоком уровне. По оценкам, в 2022 году объем общемировых инвестиций в НИОКР достиг 2,476 триллиона долларов США, что стимулирует постоянный уверенный рост числа патентных заявок, который, в свою очередь, создает нагрузку на глобальную патентную экосистему, в особенности на патентные ведомства. Увеличение числа и сложности патентных заявок может привести к значительным задержкам в выдаче патентов, что влечет за собой правовую неопределенность, которая может препятствовать инновационной деятельности, сдерживать инвестиции в НИОКР и подрывать конкурентоспособность экономики стран.
Исследование, проведенное Японским патентным ведомством в 2018 году, показало, что его патентные эксперты тратят 30 процентов своего рабочего времени на поиск информации о предшествующем уровне техники (доказательств того, что изобретение уже известно) и еще 10 процентов – на его анализ.
Одним из методов, применяемых патентными ведомствами для ускорения работы с заявками, является использование искусственного интеллекта (ИИ) в качестве подручного средства при выявлении потенциального уровня техники во время экспертизы. ИИ способен с высокой скоростью имитировать человеческую способность сравнивать данные в патентных заявках и существующих патентах и непатентных публикациях для обнаружения сходных характеристик, которые могут быть проанализированы патентными экспертами при определении известного уровня техники. Несмотря на то что это не отменяет необходимость рассмотрения результатов поиска экспертами-людьми, использование ИИ может значительно ускорить рассмотрение более чем 70 процентов заявок.
ИИ способен с высокой скоростью имитировать человеческую способность сравнивать данные в патентных заявках и существующих патентах и непатентных публикациях для обнаружения сходных характеристик, которые могут быть проанализированы патентными экспертами...
Основываясь на данных ВОИС, CAS – подразделение Американского химического общества – подсчитало, что с 2012 по 2021 год в пяти ведущих патентных ведомствах среднегодовые темпы роста числа патентных заявок составили 4,4 процента. Помимо увеличения числа патентных заявок также наблюдается повышение сложности патентов, о чем свидетельствует число пунктов в формуле изобретения, цитируемых в формуле патентов, ссылок на известный уровень техники на патент, а также другие показатели.
Определение известного уровня техники – сложный, итеративный и трудоемкий процесс. Для каждой заявки специалисты по патентному поиску и патентные эксперты должны разработать стратегию поиска, определить, какие базы данных использовать, провести поиск, оценить результаты и, при необходимости, уточнить и повторить поиск с использованием других параметров.
Масштабы проводимого поиска могут быть ошеломительными. Согласно проведенному Европейским патентным ведомством исследованию , всесторонняя процедура поиска в рамках рассмотрения патентной заявки может проводиться на основании поиска предшествующего уровня техники, включающего порядка 1,3 миллиарда технических записей в 179 базах данных, вследствие чего ежемесячно в результатах поиска значится около 600 миллионов документов.
На основании поиска предшествующего уровня техники, включающего порядка 1,3 миллиарда технических записей в 179 базах данных, вследствие чего ежемесячно в результатах поиска значится около 600 миллионов документов.
Появление новых технологий и возрастающая сложность патентных заявок требуют от экспертов постоянного повышения квалификации в своей профессиональной области. При условии обучения на основе тщательно проверенных и структурированных данных ИИ может ускорить данный процесс, анализируя миллионы наборов данных и предоставляя ссылки на сведения, потенциально противоречащие рассматриваемой заявке.
Некоторые патентные ведомства обращаются к решениям на основе искусственного интеллекта (ИИ), которые помогают им справиться с растущим числом и сложностью патентных заявок. По информации ВОИС, в 27 национальных патентных ведомствах в настоящий момент реализуется более 70 связанных с ИИ инициатив в области поиска для установления уровня техники. Несмотря на то что данные решения не охватывают все этапы экспертизы, они призваны способствовать ее ускорению, сокращая время обработки заявок и, в конечном счете, повышая удовлетворенность клиентов.
Например, Канадское ведомство интеллектуальной собственности использует коммерчески доступные поисковые системы на основе ИИ для выявления связей между ссылками, заявками и текущим уровнем техники. Японское патентное ведомство (ЯПВ) применяет ИИ для индексации файлов, благодаря чему в автоматическом режиме предлагаются соответствующие патентные классификации и ключевые слова, а патентные документы известного уровня техники упорядочиваются в зависимости от их релевантности. В тоже самое время Ведомство Соединенных Штатов Америки по патентам и товарным знакам (ВПТЗ США) использует ИИ для определения патентоспособности, анализа всей процедуры выдачи патента, а также для улучшения доступа общественности к данным ВПТЗ США.
Машинное обучение эффективно для поиска по тексту и индексированным терминам, однако применительно к связанным с составом вещества патентам, в которых важные данные часто содержатся в химических формулах, показатели его эффективности ниже.
В недавнее время Национальный институт промышленной собственности Бразилии (INPI) совместно с CAS реализовал проект, в рамках которого рабочий процесс был оптимизирован с помощью ИИ для ускорения поиска по уровню техники в области химии. Заявки в области химии, которые составляют примерно 15 процентов от общего числа нерасмотренных заявок в INPI Бразилии, являются чрезвычайно сложными и требуют как поиска по тексту, так и по химической формуле патентов и непатентных публикаций. ИИ-компонент данного решения объединяет в себе четыре одновременно функционирующих алгоритма, которые выполняют различные виды анализа сходства и другие типы анализа для обеспечения высокой релевантности результатов.
Каждый алгоритм имеет свои преимущества. Машинное обучение эффективно для поиска по тексту и индексированным терминам, однако применительно к связанным с составом вещества патентам (когда смешиваются два или более соединения), в которых важные данные часто содержатся в химических формулах, показатели его эффективности ниже. Аналогичным образом, с помощью базы данных графиков можно выявить сходства и связи, которые машинное обучение определить не способно. Затем ансамбль-алгоритм анализирует полученные по итогам работы четырех потоков алгоритмов результаты и составляет единый список публикаций, которые с наибольшей вероятностью могут препятствовать одобрению целевой заявки.
С точки зрения производительности польза была значительной:
В обучении алгоритмов ИИ решающее значение имеют качественные данные. Чем больше данных доступно для алгоритмов машинного обучения, тем более релевантными, надежными и заслуживающими доверия могут быть результаты их работы. Большая часть общедоступных непроверенных данных может содержать ошибки при записи данных, неправильно обозначенные единицы и слишком сложные формулировки, использованные для написания патентной документации, что затрудняет проведение поиска. Данная особенность представляет особенную сложность в области химии и медико-биологических наук, где вещества описываются по-разному в различных публикациях или содержат ключевые слова в таблицах или изображениях. Использование отобранных учеными данных, которые были нормализованы, подготовлены и собраны воедино в структурированном формате, облегчает поиск информации и повышает качество обучения алгоритмов ИИ и эффективность поиска для установления уровня техники.
Несмотря на то что обучение может проходить по-разному в зависимости от применяемой технологии, целевого сектора или области применения, фундаментальный подход к применению ИИ остается неизменным.
Реализация проекта в интересах IMPI Бразилии в основном базировалась на использовании CAS Content Collection™, крупнейшего в мире фонда данных в области химии и медико-биологических наук, которые извлекаются, индексируются и связываются между собой для упрощения доступа и поиска необходимой информации. Кроме того, в случайном порядке из набора для обучения алгоритма была изъята выборка патентов, которая была использована в качестве контрольной для измерения точности результатов и поисковой выдачи. Данные патенты были проанализированы экспертами патентных ведомств Китая, Японии, Соединенных Штатов Америки и Европы и проверены на предмет релевантности нашей собственной командой специалистов по поиску в области ИС.
Несмотря на то что обучение может проходить по-разному в зависимости от применяемой технологии, целевого сектора или области применения, фундаментальный подход к применению ИИ остается неизменным. Для любой области технологий используемые конфликтные ссылки определяются в процессе экспертизы для каждого набора данных для обучения. В крайне сложных областях техники, таких как химия, можно добиться лучших результатов при помощи набора данных для обучения по конкретной теме, однако в других областях применение данного подхода может не обеспечить значительного повышения эффективности. Во многих областях модели функционируют эффективно в том случае, если соответствующая технология представлена в общем обучающем наборе данных.
Тем не менее качество данных имеет большое значение.
Проектные группы по ИИ должны обладать широкими познаниями в предметной области. Проект INPI Бразилии объединил технологии и экспертов в сфере аналитики данных, интеграции рабочих процессов, высокопроизводительных вычислений, научного поиска и многих других дисциплин.
Специалисты такой группы должны обладать межфункциональным знаниями и опытом решения соответствующих проблем и достижении целевых результатов. Например, человек с опытом работы в области науки о данных может не справиться с разработкой полноценно функционирующего алгоритма, если такой специалист не разбирается в нюансах, касающихся химических соединений. Специализирующиеся на вычислениях ученые, которые создают модели машинного обучения, также должны разбираться в химии и структурных формулах.
Еще одной дисциплиной, играющей важную роль в создании комплексного решения для патентных бюро, является интеграция рабочих процессов. Экспертам, которым в ходе экспертизы приходится использовать много разных систем и перемещаться по множеству папок для поиска документов, может оказаться полезным улучшение их рабочего процесса и совершенствование технологий в виде создания единой информационной панели, которая предоставляет доступ и возможность проанализировать любую заявку или сопроводительный документ, показывает, почему были возвращены те или иные справочные документы и как формируются результаты, при этом обеспечивая отслеживаемость операций, что необходимо им для документирования решений при обработке заявки и проведения внутренней проверки качества.
Значительное повышение производительности и эффективности работы патентных ведомств, а также качества обслуживания клиентов возможно при условии, если эксперты смогут использовать инструменты, созданные на основе новейших технологий, таких как ИИ. По мере ускорения инновационной деятельности растет число и сложность патентных заявок. Это означает, что патентным ведомствам и далее будет необходимо применять новые методы, чтобы оптимизировать процедуру патентной экспертизы и, как следствие, соответствовать ожиданиям заинтересованных сторон в отношении более высокого уровня оказания услуг.
Хотя ИИ и может помочь в выполнении подобных постоянно меняющихся задач, для реализации индивидуализированных подходов все равно будут требоваться специалисты. Универсальный подход невозможен, так как потребности каждого патентного ведомства уникальны. Патентные ведомства ведут в целом схожую деятельность, однако уровень кадрового обеспечения и доступных технологий, необходимых для поддержания работы в каждой области, различаются. Несмотря на то что алгоритмы могут быть использованы для решения общих задач, методы взаимодействия экспертов с результатами могут отличаться в зависимости от существующей технологической среды.
Значительное повышение производительности и эффективности работы патентных ведомств, а также качества обслуживания клиентов возможно при условии, если эксперты смогут использовать инструменты, созданные на основе новейших технологий, таких как ИИ.
Патентным ведомствам, которые стремятся достичь поставленных стратегических целей, потребуются подходящие инновации, которые, несмотря на ограниченность ресурсов, будут отвечать ожиданиям заинтересованных сторон. Обеспечить гибкость, необходимую для поддержания устойчивого совершенствования рабочих процессов в будущем, можно за счет правильного сочетания данных, технологий и человеческих знаний и опыта.
Больше информации о том, как эффективность глобальной патентной системы может быть повышена с помощью ИИ, доступно в белой книге CAS под названием Sustainability of the Global Patent System: the role of AI in enhancing productivity («Устойчивость глобальной патентной системы: роль ИИ в повышении производительности»).
В подготовке статьи приняли участие: Мэтью Брайан и Андраш Йокути, Сектор патентов и технологии, ВОИС
Бруно Пулекен, Ульрике Тилль и Юн Ён У, Сектор инфраструктуры и платформ, ВОИС
Редактор: Кэтрин Джуэлл
«Журнал ВОИС» призван помочь читателям улучшить свое понимание интеллектуальной собственности и деятельности ВОИС и не является официальным документом ВОИС. Используемые в этой публикации обозначения и представляемые материалы никоим образом не выражают мнение ВОИС относительно правового статуса каких бы то ни было стран, территорий или районов или их органов власти или относительно делимитации их границ. Данная публикация не преследует цели отразить точку зрения государств-членов или Секретариата ВОИС. Упоминание в публикации конкретных компаний или продуктов определенных производителей не означает, что ВОИС их поддерживает или рекомендует или отдает им предпочтение перед другими аналогичными компаниями и продуктами, которые в материалах не упомянуты.