产权组织术语数据库十种语言的表现均有提高
Tue Aug 20 09:00:00 CEST 2019产权组织的免费术语数据库——WIPO Pearl——以十种语言收录近18万个术语,并且现在适用于移动设备的界面。全新的外观和体验使用户可以直接在术语搜索结果列表和清晰的全屏模式下查看创新的概念图和人工智能驱动的概念云,有助于帮助创新者阐明科技术语之间的关系。
关于WIPO Pearl
WIPO Pearl于2014年推出,旨在促进科技术语在产权组织管理的国际专利体系——《专利合作条约》(PCT)——的十种公布语言之间以准确、一致的方式使用,使跨语言搜索和共享科技知识更为简便。
科技术语可以用45种不同的语言组合进行搜索,还可以在欧洲语言和亚洲语言之间,以及任何一种欧洲或亚洲语言和阿拉伯语之间进行搜索。这使得WIPO Pearl在当前网上免费提供的语言资源中独具优势。
WIPO Pearl由产权组织经验丰富的语言专家和术语专家开发,这些专家负责验证术语并对术语分配可靠性分值。数据质量很高,因为每个术语都是人为生成的,并且在被认为适合公布之前,至少由另一位语言专家进行验证,有时还经过技术领域的专家验证。
术语目前取自通过产权组织PCT体系提交的国际专利申请,囊括29个涵盖了所有科技领域的主题,最近还包括对话界面(聊天机器人)、量子计算、绿色化学、医学机器人和生物控制等尖端领域。术语附有用法标签,告知用户该术语是推荐的、过时的还是标准化的。每个术语都配有内容丰富的上下文,帮助说明术语的含义和用法。上下文提取自同样作了标引的权威来源。此外,唯一且可共享的URL现在与完整术语记录相关联,这样的记录包含关于概念和术语的所有信息。
全球合作伙伴
另外,包括大学和政府机构在内的全球合作伙伴网络在不断扩大,现在通过学生和术语专家提供的术语以新概念扩充WIPO Pearl,而合作院校的主题领域专家则负责检查其专业领域内术语的准确性并提高可靠性分值。
概念图
WIPO Pearl独有的概念图允许用户通过查看概念之间的链接来浏览领域知识。这些链接已经由术语专家研究并手动输入,以显示比其他概念更宽或更窄的概念。目前,18,000多个概念(或数据库中现有概念的85%)链接到其他概念,并在概念图中显示。
用户还可以利用概念图子集中显示的信息(所谓的概念路径),在产权组织的专利数据库PATENTSCOPE中进行组合关键字搜索。这项功能将相关概念、同义词、缩写和拼写变体集中在一起,有助于高度针对性地检索专利文档。在语言搜索界面按术语进行传统搜索获得的结果列表中,有浏览PATENTSCOPE和检索相关专利文档的选项。
WIPO Pearl和人工智能
除了提供人工构建并验证的概念图之外,WIPO Pearl还对人工智能生成的所谓的概念云加以利用。开源深度学习算法已经就术语、上下文和手动输入的概念关系的完整数据集进行了训练,以便对概念之间新的关系群进行提示。这些接着可以在概念图中显示为概念云。WIPO Pearl是第一个以此类创新为特色的术语数据库。
WIPO Pearl还集成了WIPO Translate,后者是产权组织内部开发的机器翻译引擎,采用创新的神经机器翻译(NMT)技术,以便在目标语言之一没有某一术语的情况下为用户提供机器翻译。一个概念在术语数据库中根本没有出现时,查询就会被重定向到PATENTSCOPE CLIR。
新功能
截至2019年5月,WIPO Pearl提供全新且改进的外观和体验,并具有移动响应能力。此外,在最近添加阿拉伯文之后,用户界面现在以所有十种PCT公布语言提供,使用户可以选择以自己偏好的语言浏览应用程序。WIPO Pearl的未来发展包括开发允许从其他应用程序访问数据集的接口,并开发完善的移动应用程序。时机成熟时,WIPO Pearl还将包括产权组织其他领域的数据,例如商标、工业品外观设计和产权组织管理的其他条约中的术语,这将使WIPO Pearl成为多语言知识产权术语的完整参考源。