Узнайте, как найти Всемирный словарь гендерных имен ВОИС и пользоваться им. Определите гендерную принадлежность человека в любом наборе данных, выполнив несколько простых операций.
Примерное время прочтения: 5 минут
Всемирный словарь гендерных имен (WGND) теперь предлагается в версии 2.0 с большим числом доступных данных по странам и территориям, а также именам физических лиц. Файлы документации и библиотеки WGND доступны в режиме онлайн, чтобы пользователи могли начать применять словари гендерных имен к любому набору данных с именами, которые сопровождаются географическими кодами.
Всемирный словарь гендерных имен был расширен благодаря недавнему исследованию и теперь включает более 26 миллионов записей, в которых указываются имена физических лиц, относящиеся к 195 различным странам и территориям. WGND 2.0 является дополненной версией WGND 1.0 и результатом компиляции более чем 50 различных новых различных источников гендерных данных и обновления первоначального списка источников.
WGND 2.0 доступен онлайн на странице открытого проекта по гендерной тематике IES Gender Open Source Project. На странице представлен специальный репозиторий Github с документацией, описывающей различные наборы уникальных наблюдений за гендерными данными, привязанными к кодам стран и языков. Сопроводительная документация для версий словаря 1.0 и 2.0 доступна на сайте Harvard Dataverse.
Первый шаг: подготовьте набор данных с именами физических лиц и кодами стран. Как только набор данных готов, следующим шагом будет выполнение следующих четырех проверочных процедур для очистки данных:
После этого следует воспользоваться инструментом Gender-it на ресурсе GitHub для применения библиотек Всемирного словаря гендерных имен к полученному очищенному набору данных. Gender-it содержит библиотеки WGND версии 2.0, ими можно воспользоваться с помощью Stata или Python (ознакомьтесь с видеоуроком ниже). Библиотеки в этих вариантах программного обеспечения содержат подробные инструкции и примеры загрузки необходимых файлов документации, функций и пакетов для сопоставления очищенной базы данных пользователя с разновидностями словарей гендерных имен, доступных в WGND версии 2.0. Для начала работы пользователям Stata следует открыть файл tutorial_genderit.do а пользователям Python – файл introduction to gender-it.ipynb file.
Видеоурок разделен на четыре раздела, которые призваны помочь пользователям научиться использованию библиотек Всемирного словаря гендерных имен версии 2.0; перейти к нужному разделу вы можете с помощью функции перемотки.
Советы и рекомендации 32:40 мин.