创新方面的性别差距:创建《世界性别人名词典》
2021年7月22日
2021年7月 ・ 5 minutes reading time
创新方面的性别差距:创建《世界性别人名词典》
衡量女性参与发明、创造和创新活动的情况,对于制定有效的创新和知识产权对于制定有效的创新和知识产权包容性政策至关重要。然而,大多数国家和国际创新和知识产权数据来源缺乏任何类型的性别分类指标/措施。
《世界性别人名词典》(WGND)有助于解决这一数据差距。
为什么需要《世界性别人名词典》?
衡量创造者、发明者和创新者的性别是一项重要投入,可以为创新政策的制定提供具体证据。与性别有关的经济研究指出,由于缺乏适当工具和数据来源而无法确定这些才华横溢的人们的性别。尤其具有挑战性的,是寻求全球覆盖面可接受的具有性别分类的创新数据。
可以通过几种方法来获得具有性别分类的创新数据。
不过相比其他方式,WGND拥有若干优势。首先,它使用包含丰富信息的当前和历史创新记录,并根据创新者或创造者的人名归纳其性别。第二,WGND覆盖全球,可对世界上大多数人口进行性别归纳。第三,使用可获得的公共资源,即可持续应用——甚至溯及以往。因此,大多数关于全球女性专利申请的研究都使用了性别-人名词典。
性别-人名词典里有什么?
简而言之,性别-人名词典意味着使用对应其最常见性别的人名列表。
一般来说,性别-人名词典最好与创新者或创造者的来源地信息,例如国籍,结合起来使用。这主要是因为命名习俗因各国而异。例如,Andrea通常在美国为女名,在意大利为男名。因此,WGND(和许多其他词典)提供姓名、国家和最常见性别的组合。
同样的逻辑也适用于语言,因为在讲同一种语言的国家,许多命名习俗是一致的。在同一个例子中,Andrea在所有西班牙语国家通常为女名,在讲意大利语的地区通常为男名,例如在瑞士卢加诺。WGND利用这一特点,为所有使用相同官方语言的国家推展姓名-性别对,从而增加其覆盖面。最新版本的WGND还提供了姓名、语言和最常见性别的组合。
即使在同一国家或语言中,也有一些人名可同时用于女性和男性。许多性别-人名词典以两种方式对此作出了说明。有时,它们包含不分性别或未知性别的类别。其他时候,它们提供人名和对应性别的频率。例如,在西班牙,Andrea这个名字在97.7%的情况下被认为是女名,只有2.3%的情况下被认为是男名。为了说明这些情况,最新的WGND在可能的情况下,会报告人名、国家和对应性别的预期频率。
当然,性别归纳的质量在很大程度上取决于性别-人名词典的质量和覆盖面。因此人名的全球覆盖面对这样的词典而言至关重要。
WGND是如何创建的?
归纳性别所面临的主要挑战,是获得覆盖全球的性别-人名词典。为此,WGND尽可能多地汇编了不同国家公共和私人来源的性别-姓名词典。WGND根据各国最常用的官方语言在已有基础上进行扩大,以增加现有国家性别-人名词典的全球覆盖面。
人名的最佳来源是国家公共机构。通常情况下,这些机构是社会保障局、统计研究所和/或人口注册机构。其他来源包括分享其方案成果的学术研究和类似的性别研究。特别的来源可以作为补充,例如网络上提供的按国家划分的流行人名列表。
人名词典的另一个来源,是依靠内部记录或内部知识来建立补充性的人名-词典列表。然而,普通公众可能很难接触到这种类型的来源。例如,大多数联合国机构,如产权组织,倾向于收集其成员国大会、会议、培训等的参与者名单信息。出于礼节,名单上的参与者姓名往往包含其尊称,包括“先生”和“女士”。国家知识产权局可以依靠历史工作人员长期记录来编制类似名单,由此创建自己的词典。另一个潜在来源是依靠翻译和国际同行来修订词典中的任何盲点。
值得注意的是,不同来源可能会就特定人名的性别产生冲突。这些往往是少数情况,但必须得到恰当处理。一种选择是将其处理为频率,效仿上文提到的Andrea这个名字在西班牙的例子。
创建首部《世界性别-人名词典》,并对其进行更新
2016年,产权组织整合了首部《世界性别-人名词典》(WGND)以确定女性发明人的参与情况。词典共汇编了来自14个不同来源的信息,这些信息合并后涵盖182个不同国家和领土。
这14个来源——13个公开来源和一份特别列表——共有319,785对人名和领土。鉴于讲同一语言的国家之间在性别归纳上的冲突相对较少,WGND以官方语言为基础扩大了覆盖面。
首部WGND在通用语为12种常用语言的基础上扩大了人名-国家对的范围:
- 阿拉伯语;
- 荷兰语;
- 英语;
- 法语;
- 德语;
- 意大利语;
- 日语;
- 韩语;
- 葡萄牙语;
- 俄语;
- 西班牙语;
- 中文。
这便将结果扩大到了另外108个不同国家。
最终,首部WGND包含600多万个特有的人名-国家对,涵盖182个国家。
最近,产权组织重新审视WGND,并根据最新数据和额外来源对其进行了扩充。第二版汇编了40多个不同来源,包括500万对人名和领土,并扩大到100种其他语言。
由此产生的第二版WGND提出了与195个不同国家和领土相关联的2,600多万个人名,以供辨别创新和知识产权数据中自然人的性别。
您现在可以在GitHub资源库中查找、使用和处理该词典的最新版本。
您可能喜欢的其他故事
如何衡量创新方面的性别差距
可以通过若干种方法来获得具有性别分类的创新和知识产权数据。看看哪一种更适合您的情况。
我们对创新方面的性别差距了解多少?
从事创新、发明和创造的妇女面临着阻碍其活动的持续因素。经济研究对此能够告诉我们什么,又能为性别平衡政策提供什么信息?