WIPO Translate:为专利文献开发的尖端翻译工具已扩大语言覆盖面
日内瓦,
Mon Sep 25 08:56:34 CEST 2017
PR/2017/809
世界知识产权组织针对专利文献开发的基于“人工智能”的开创性翻译工具现可以十种语言提供服务,标志着这一提供获取新技术信息的最高质量服务向前迈进了重要一步。
WIPO Translate利用尖端神经机器翻译技术,将高度技术性的专利文献转换为第二种语言,并且风格和句法更贴近通用说法,胜过建立在以往技术上的专利翻译工具,也超越其他同样利用人工智能的基于网络的产品。
WIPO Translate支持PATENTSCOPE这一拥有6,500万条记录的强大数据库,发明者可先利用PATENTSCOPE进行检索,再通过产权组织《专利合作条约》(PCT)在世界各地提交国际专利申请。
产权组织对新技术进行了“训练”,使之将PCT官方语言(阿拉伯文、德文、西班牙文、法文、韩文、日文、葡萄牙文、俄文和中文)之一的所有专利文献与英文互译。而2016年发布的一个初始版本只能提供英文和中文。
“WIPO Translate扩大到更多语言对,这是全球创新者喜闻乐见的进展。这一进展确保了技术发明中以主要语言创造的先进知识能被获得,”产权组织总干事弗朗西斯•高锐说。“WIPO Translate的翻译速度和准确性是绝无仅有的。这是因为这项工具被训练为仅针对专利文献,而非一系列差异更大的文本,因此能产出更高质量的译文,”他补充到。
WIPO Translate被训练为专门针对数量庞大的专利文本,并拥有一项“领域识别技术”,可以根据发明的具体特点进行翻译。该工具内部集成了国际专利分类中的32个技术领域,能够避免系统在翻译过程出现歧义。这种技术在翻译某一特定句子时,可以对该句所属的具体领域加以考虑,从而能够产出更准确的译文。这项功能在专利翻译界是独一无二的。
产权组织的PATENTSCOPE数据库现与这种新技术完全兼容(为进行对比,仍可使用基于统计的翻译技术),能够更加方便地提供通过PATENTSCOPE生成的专利文献译文。
神经机器翻译是一种新兴技术。它建立在庞大的、能够“学习”之前翻译过的句子的神经网络模型上。神经机器翻译的特点(与之前“基于短语”的统计方法相比)在于,它产生了更为自然的语序,并在所谓的差异性较大的语言对中,如日文-英文或中文-英文中有显著的进步。即使是被视作相近的语言(如英文-法文)也获益于这种新技术,提高了译文质量。
产权组织在开放源代码软件和图书馆的基础上开发了自己的软件,并利用内部专家来处理庞大的数据集。
WIPO Translate供其他联合国机构和国际组织免费使用。这些组织机构的翻译需求往往很大、成本很高。
给编者的说明
PATENTSCOPE数据库提供了自国际专利合作条约申请公布之日起即可访问其全文,和参与的国家或地区专利局专利文献的服务。可以用多种语言输入关键词、申请人姓名、国际专利分类以及其他条件来检索信息。数据库中有大约6,500万条记录。