Терминологическая база данных ВОИС на десяти языках выходит на новый уровень функциональности
Tue Aug 20 09:00:00 CEST 2019Бесплатная терминологическая база данных ВОИС «WIPO Pearl», насчитывающая уже почти 180 000 терминов на 10 языках, теперь предлагает интерфейс, адаптированный под мобильные устройства. Новый внешний вид и функциональность позволяют пользователям видеть оригинальные «понятийные карты» и «понятийные облака», сформированные при помощи ИИ, непосредственно в окне выдачи результатов поиска по ключевым словам в удобном для пользования полноэкранном режиме, что, в свою очередь, позволяет изобретателям более четко выявлять взаимосвязи между различными научно-техническими терминами.
О базе данных «WIPO Pearl»
База данных «WIPO Pearl» была создана в 2014 г. с целью способствовать корректному и последовательному использованию научно-технических терминов на 10 языках публикации Договора о патентной кооперации (PCT) (международной патентной системы, административные функции которой выполняет ВОИС), облегчая поиск и совместное использование научно-технической информации на различных языках.
Поиск по базе научно-технических терминов может проводиться по 45 различным языковым парам, включая поиск между европейскими и азиатскими языками, а также между любым из этих языков и арабским языком. Это придает базе данных «WIPO Pearl» уникальность среди предлагаемых в настоящее время в Интернете бесплатных терминологических ресурсов.
База данных «WIPO Pearl» разрабатывается опытными экспертами-лингвистами и терминологами ВОИС, которые перепроверяют значение различных терминов и присваивают им рейтинги надежности. Высокое качество данных обеспечивается тем, что все термины, которые были сочтены пригодными для включения в базу, предлагаются специалистами и перепроверяются по меньшей мере еще одним лингвистом, а в некоторых случаях – еще и экспертом в соответствующей технической области.
На сегодняшний день в качестве источника терминов для включения в базу используются международные патентные заявки, подаваемые в рамках системы РСТ ВОИС; база данных насчитывает 29 предметных областей, охватывающих все отрасли науки и техники, а с недавнего времени включает в себя и такие передовые направления работы, как диалоговые интерфейсы («чатботы»), квантовые вычисления, разработки в области экологически безопасной химии, медицинскую робототехнику и биологический контроль. Термины сопровождаются пояснениями, информирующими пользователя о том, является ли тот или иной термин рекомендуемым для использования, устаревшим или стандартизованным. С целью прояснить значение терминов и практику их использования они иллюстрируются контекстуально информативными примерами. Примеры использования терминов в контексте берутся из авторитетных источников и снабжаются ссылками. Кроме того, каждая развернутая терминологическая запись, содержащая всю наличную информацию о соответствующем понятии и связанных с ним терминах, теперь имеет уникальный и общедоступный URL-адрес.
Международные партнеры
Кроме того, сегодня свой вклад в развитие базы данных «WIPO Pearl» вносит постоянно расширяющаяся сеть партнеров в различных странах мира, включая университеты и правительственные ведомства, которые в лице студентов и терминологов обогащают базу новыми понятиями, включая в нее дополнительные термины, а профильные специалисты из учреждений-партнеров перепроверяют те термины, которые относятся к сфере их специализации, повышая рейтинг их надежности.
«Понятийные карты»
Уникальным элементом базы данных «WIPO Pearl» являются «понятийные карты», которые предоставляют пользователям возможности для ознакомления с интересующими их темами, изучая взаимосвязи между различными понятиями. Терминологи исследуют эти взаимосвязи и вводят их в базу вручную, с тем чтобы отражать в ней понятия, более широкие или боле узкие по своему охвату, чем другие понятия. В настоящее время 18 000 понятий (или 85% всех понятий, присутствующих в базе данных) увязаны с другими понятиями и появляются на «понятийных картах».
Кроме того, пользователи имеют возможность опираться на данные, отражаемые в подклассах «понятийных карт» (на так называемых «понятийных траекториях»), при проведении поиска по группам ключевых слов в базе данных ВОИС по патентам PATENTSCOPE. Эта функция позволяет свести воедино связанные между собой понятия, синонимы, аббревиатуры и варианты написания терминов, что, в свою очередь, облегчает подбор патентных документов по узкоспециализированным критериям. Кроме того, в окне выдачи результатов традиционного поиска по ключевым словам в интерфейсе «Языковой поиск» имеется функция просмотра соответствующих патентных документов в базе данных PATENTSCOPE.
База данных «WIPO Pearl» и искусственный интеллект
В дополнение к «понятийным картам», которые составляются и перепроверяются специалистами, в базе данных «WIPO Pearl» также имеются так называемые «понятийные облака», генерируемые при помощи искусственного интеллекта. При этом используется имеющийся в открытом доступе алгоритм глубокого обучения, в котором отражен полный комплекс терминов, контекстуальной информации и введенных в базу вручную данных о взаимосвязях между различными понятиями, с тем чтобы он мог генерировать новые кластеры взаимосвязей между понятиями. Затем эти кластеры могут отображаться внутри «понятийных карт» в качестве «понятийных облаков». База данных «WIPO Pearl» - это первая база терминологических данных, в которой использована такая инновационная концепция.
База данных «WIPO Pearl» также интегрирована с системой «WIPO Translate» - программой машинного перевода, разработанной ВОИС собственными силами с применением инновационной технологии нейронного машинного перевода (НМП), которая предлагает пользователям варианты машинного перевода терминов, отсутствующих в базе данных на интересующем их языке. В тех случаях, когда то или иное понятие пока еще не нашло отражения в базе терминологических данных, запрос переадресовывается на страницу PATENTSCOPE CLIR.
Новые функции
С мая 2019 г. база данных «WIPO Pearl» имеет обновленный внешний вид и функциональность, дополненную адаптацией под мобильные устройства. Кроме того, благодаря недавнему добавлению арабского языка пользовательский интерфейс в настоящее время доступен на всех 10 языках публикации РСТ, что позволяет пользователям работать с базой данных на любом удобном для них языке. Дальнейшие планы в отношении базы данных «WIPO Pearl» включают в себя разработку интерфейсов, позволяющих получать доступ к массиву данных из других приложений, а также мобильного приложения с полным набором функций. Кроме того, в будущем база данных «WIPO Pearl» также будет включать в себя данные, относящиеся к другим сферам деятельности ВОИС, включая товарные знаки и промышленные образцы, а также терминологию, используемую в других договорах, административные функции которых выполняет ВОИС, в результате чего она превратится в исчерпывающий источник справочной информации по терминологии ИС на различных языках.