关于知识产权 知识产权培训 知识产权外联 部门知识产权 知识产权和热点议题 特定领域知识产权 专利和技术信息 商标信息 工业品外观设计信息 地理标志信息 植物品种信息(UPOV) 知识产权法律、条约和判决 知识产权资源 知识产权报告 专利保护 商标保护 工业品外观设计保护 地理标志保护 植物品种保护(UPOV) 知识产权争议解决 知识产权局业务解决方案 知识产权服务缴费 谈判与决策 发展合作 创新支持 公私伙伴关系 组织简介 与产权组织合作 问责制 专利 商标 工业品外观设计 地理标志 版权 商业秘密 WIPO学院 讲习班和研讨会 世界知识产权日 WIPO杂志 宣传 案例研究和成功故事 知识产权新闻 产权组织奖 企业 高校 土著人民 司法机构 遗传资源、传统知识和传统文化表现形式 经济学 性别平等 全球卫生 气候变化 竞争政策 可持续发展目标 执法 前沿技术 移动应用 体育 旅游 PATENTSCOPE 专利分析 国际专利分类 ARDI - 研究促进创新 ASPI - 专业化专利信息 全球品牌数据库 马德里监视器 Article 6ter Express数据库 尼斯分类 维也纳分类 全球外观设计数据库 国际外观设计公报 Hague Express数据库 洛迦诺分类 Lisbon Express数据库 全球品牌数据库地理标志信息 PLUTO植物品种数据库 GENIE数据库 产权组织管理的条约 WIPO Lex - 知识产权法律、条约和判决 产权组织标准 知识产权统计 WIPO Pearl(术语) 产权组织出版物 国家知识产权概况 产权组织知识中心 产权组织技术趋势 全球创新指数 世界知识产权报告 PCT - 国际专利体系 ePCT 布达佩斯 - 国际微生物保藏体系 马德里 - 国际商标体系 eMadrid 第六条之三(徽章、旗帜、国徽) 海牙 - 国际外观设计体系 eHague 里斯本 - 国际地理标志体系 eLisbon UPOV PRISMA 调解 仲裁 专家裁决 域名争议 检索和审查集中式接入(CASE) 数字查询服务(DAS) WIPO Pay 产权组织往来账户 产权组织各大会 常设委员会 会议日历 产权组织正式文件 发展议程 技术援助 知识产权培训机构 COVID-19支持 国家知识产权战略 政策和立法咨询 合作枢纽 技术与创新支持中心(TISC) 技术转移 发明人援助计划(IAP) WIPO GREEN 产权组织的PAT-INFORMED 无障碍图书联合会 产权组织服务创作者 WIPO ALERT 成员国 观察员 总干事 部门活动 驻外办事处 职位空缺 采购 成果和预算 财务报告 监督

创新方面的性别差距:使用《世界性别人名词典》

了解如何找到和应用产权组织的《世界性别人名词典》。只需要简单的几步,就能从任何数据集中辨别性别。

预计阅读时间:5分钟

gender-diversity-845
(图: damircudic/Getty images)

《世界性别人名词典》(WGND)现已推出2.0版本,国家和领土以及自然人姓名的记录有了更高的可用性。该词典的文档文件和库可供用户在线使用,以便开始将性别人名词典应用于任何与地理编码相关的人名数据集。

近期的研究为扩充《世界性别人名词典》做出了新的贡献,现在该词典包括2,600多万条与自然人的姓名以及195个不同的国家和领土相联系的记录。《世界性别人名词典》2.0版是对其前身1.0版本的更新,是对50多个新的不同性别数据来源进行汇编和对原有来源清单进行更新后的成果。

 

哪里可以找到《世界性别人名词典》2.0版?

可以在IES性别开源项目中在线使用《世界性别人名词典》2.0版。该版本有一个专门的GitHub存储库,其中的文档描述了与国家和语言代码相联系的关于性别数据的不同独特观察集。《世界性别人名词典》1.0版和2.0版的证明文档也可以在哈佛大学Dataverse上查阅。

 

如何使用《世界性别人名词典》2.0版?

第一步是准备一个含有自然人姓名和国家代码的数据集。这个数据集准备好之后,下一步就是进行以下四项数据清理检查:

  • 删除姓名记录中的家族姓名或姓氏,从而在姓名变量中只留下名字或主名。
  • 将其余的姓名记录设置为小写,并删除姓名文字前后的空白。
  • 删除构成每条最终姓名记录的单词之间的双空格。
  • 确保数据集中包含的国家和领土代码是ISO 3166-1中定义的二位字母代码。可供使用的ISO二位代码的完整列表可在国际标准化组织(ISO)在线浏览平台io中在线查阅。

然后,用户可以访问GitHub中的Gender-it tool工具,将《世界性别人名词典》2.0版的库应用于得到的已清理数据集。Gender-it包含可通过StataPython检索的《世界性别人名词典》2.0版的库(观看下面的视频教程)。这些软件选项中的库包含详细的说明和实例,用于下载必要的文档文件、函数和软件包,以便将用户的已清理数据库与《世界性别人名词典》2.0版中的性别人名词典类别进行匹配。Stata用户一开始可以运行tutorial_genderit.do文件,而Python用户一开始可以运行introduction to gender-it.ipynb文件

视频教程

该视频教程分为四个部分,指导用户在《世界性别人名词典》2.0版的库中工作,拖动视频至时间标记,找到所需的部分。

  • 介绍 00分00秒
  • STATA 06分48秒
  • Python 24分36秒

提示与技巧       32分40秒

关于使用产权组织《世界性别人名词典》的技术讲习班

你可能喜欢的其他故事

创建《世界性别人名词典》

《世界性别人名词典》(WGND)是帮助全世界研究人员和政策分析人员解决缺乏具有性别分类的数据来源这一问题的工具。

如何衡量创新方面的性别差距

可以通过若干种方法来获得具有性别分类的创新和知识产权数据。看看哪一种更适合您的情况。

我们对创新方面的性别差距了解多少?

从事创新、发明和创造的妇女面临着阻碍其活动的持续因素。经济研究对此能够告诉我们什么,又能为性别平衡政策提供什么信息?

相关资源

扩充《世界性别人名词典》:WGND 2.0

本文重新审视了第一部《世界性别人名词典》(WGND 1.0),该词典使我们能在为自然人命名的数据中辨别性别(Lax Martínez et al., 2016)。我们讨论了它的优点和局限性,并提出了基于最新数据和额外来源的扩充。通过纳入超过2,600万条与名字以及195个不同国家和领土关联的记录,由此产生的《世界性别人名词典》2.0版本大大增加了其处理器的国际覆盖面。因此,新版本是为了用于知识产权单位记录数据而特别设计的,这些数据为发明者、设计者、个人申请人以及这些数据中披露的其他创造者命名。

利用创新和知识产权数据进行性别分析指南

了解女性和男性如何平等地获取和利用知识产权制度,是确保其创造力转化为经济、社会和文化发展的关键所在。这份简短的指南总结了编制创新和知识产权性别指标的最佳做法