Innovation Gender Gap: The Challenges of Measuring Gender Inequality in Innovation
30 мая 2023 г.
Май 2023 г. ・ 5 minutes reading time
Гендерный разрыв в сфере инноваций: использование Всемирного словаря гендерных имен
Узнайте, как найти Всемирный словарь гендерных имен ВОИС и пользоваться им. Определите гендерную принадлежность человека в любом наборе данных, выполнив несколько простых операций.
Примерное время прочтения: 5 минут
Всемирный словарь гендерных имен (WGND) теперь предлагается в версии 2.0 с большим числом доступных данных по странам и территориям, а также именам физических лиц. Файлы документации и библиотеки WGND доступны в режиме онлайн, чтобы пользователи могли начать применять словари гендерных имен к любому набору данных с именами, которые сопровождаются географическими кодами.
Всемирный словарь гендерных имен был расширен благодаря недавнему исследованию и теперь включает более 26 миллионов записей, в которых указываются имена физических лиц, относящиеся к 195 различным странам и территориям. WGND 2.0 является дополненной версией WGND 1.0 и результатом компиляции более чем 50 различных новых различных источников гендерных данных и обновления первоначального списка источников.
Где можно найти Всемирный словарь гендерных имен версии 2.0?
WGND 2.0 доступен онлайн на странице открытого проекта по гендерной тематике IES Gender Open Source Project. На странице представлен специальный репозиторий Github с документацией, описывающей различные наборы уникальных наблюдений за гендерными данными, привязанными к кодам стран и языков. Сопроводительная документация для версий словаря 1.0 и 2.0 доступна на сайте Harvard Dataverse.
Как пользоваться Всемирным словарем гендерных имен версии 2.0?
Первый шаг: подготовьте набор данных с именами физических лиц и кодами стран. Как только набор данных готов, следующим шагом будет выполнение следующих четырех проверочных процедур для очистки данных:
- Удалите фамилии или патронимические имена в записях имен, чтобы в переменной «имя» остались только первые или основные имена.
- Переведите оставшиеся записи имен в нижний регистр и удалите пробелы до и после текста имен.
- Удалите двойные пробелы между словами, составляющими каждую окончательную запись имени.
- Убедитесь, что коды стран и территорий, содержащиеся в наборе данных, соответствуют двухбуквенным кодам (alpha-2), указанным в стандарте ISO 3166-1. Полный список доступных двузначных кодов стандарта доступен в режиме онлайн на платформе ISO Online Browsing Platformили по ссылке: io.
После этого следует воспользоваться инструментом Gender-it на ресурсе GitHub для применения библиотек Всемирного словаря гендерных имен к полученному очищенному набору данных. Gender-it содержит библиотеки WGND версии 2.0, ими можно воспользоваться с помощью Stata или Python (ознакомьтесь с видеоуроком ниже). Библиотеки в этих вариантах программного обеспечения содержат подробные инструкции и примеры загрузки необходимых файлов документации, функций и пакетов для сопоставления очищенной базы данных пользователя с разновидностями словарей гендерных имен, доступных в WGND версии 2.0. Для начала работы пользователям Stata следует открыть файл tutorial_genderit.do а пользователям Python – файл introduction to gender-it.ipynb file.
Видеоурок
Видеоурок разделен на четыре раздела, которые призваны помочь пользователям научиться использованию библиотек Всемирного словаря гендерных имен версии 2.0; перейти к нужному разделу вы можете с помощью функции перемотки.
- Введение 00:00 мин.
- STATA 06:48 мин.
- Python 24:36 мин.
Советы и рекомендации 32:40 мин.