Данные: движущая сила, преобразующая мировую экономику
Джеймс Нёртон, независимый журналист
Данные позволяют создавать инновационные продукты и услуги, улучшать жизнь людей и решать проблемы в области здравоохранения и окружающей среды. Но возникает вопрос: что нужно для того, чтобы сбалансировать полезное использование данных с необходимостью защиты прав ИС и других прав?
Что вы ели на завтрак сегодня утром? Какого вы роста? Какое давление в шинах вашего автомобиля? Когда вы в последний раз покупали что-то в интернете? Каков ваш генетический отличительный признак? По каждому аспекту нашей жизни есть данные, и последние несколько лет наша способность хранить и анализировать данные возрастала в геометрической прогрессии. Это поднимает сложные вопросы: какое значение вы придаете данным, как пользоваться ими, как безопасно делиться данными и какие права должны быть признаны и защищены?
Это лишь некоторые из тем, обсужденных в ходе четвертого раунда дискуссии ВОИС по вопросам ИС и передовых технологий (в первый и второй дни), состоявшегося в сентябре 2021 г. Передовые технологии включают искусственный интеллект (ИИ), блокчейн, интернет вещей и робототехнику, и, по оценкам, к 2025 г. объем рынка этих технологий достигнет 3,2 трлн долл. США.
Для участия в сессии зарегистрировались более 1 600 человек из 130 стран мира. В ходе продолжавшихся пять часов дискуссии были обсуждены вопросы, касающиеся защиты и регулирования данных, их значения для искусственного интеллекта и того, как сбалансировать соображения доступа и контроля, и рассмотрены примеры того, как данные используются в исследованиях и бизнесе. Обсуждались самые разные вопросы – от использования ИИ для создания музыкальных произведений до наблюдения за поведением пчел в ульях (читайте «Зловещая долина»: прокладывая путь к новой эпохе в музыкальном творчестве» и «Beewise: out-of-the-box thinking to save the world’s bees» («Beewise: нестандартный подход к спасению пчел во всем мире»).
Открывая совещание, Генеральный директор ВОИС Дарен Танг заявил, что в условиях пандемии COVID-19 процесс цифровизации ускорился: ожидается, что к 2023 г. к интернету вещей будет подключено 43 миллиарда устройств, и каждый день будет появляться более 1 миллиона новых подписчиков 5G. «Если цифровизация — это двигатель экономики будущего, то данные — это ее топливо», — сказал он, отметив, что в настоящее время 60 процентов населения мира подключено к сети: «Расширение возможностей подключения и возникающий в результате поток данных стимулируют развитие передовых технологий. В этом взаимосвязанном мире крайне важно понимать природу данных и их ценность».
Значение данных
Яркий пример огромного значения данных привел Дин Джоллифф из Всемирного банка, который председательствовал на первом групповом обсуждении на тему «Данные: вне рамок ИИ в полностью взаимосвязанном мире». В 1999 г. ураган «Боб» 06 нанес сокрушительный удар по индийскому штату Одиша, унеся жизни почти 10 000 человек. В этой ситуации государственному органу, отвечающему за ликвидацию последствий стихийных бедствий, было поручено собирать, оценивать и анализировать метеорологические данные. Когда в 2013 г. на Одишу обрушился ураган такой же силы, было эвакуировано более 1 миллиона человек и спасены тысячи жизней.
Как сказал г-н Джолифф, пример штата Одиша показывает, как ценность данных — даже данных, которые собирались и отслеживались в течение многих лет — может возрасти, если эти данные подробно анализируются. «Благодаря созданию системы сбора и обработки данных, которая сделала данные более сопоставимыми и доступными, а также позволила сообщать результаты своевременно и понятным способом, эти данные стали бесценными».
Благодаря повсеместному распространению интеллектуальных устройств и датчиков данные способны трансформировать каждый аспект бизнеса и жизни общества. Но, как сказала Аруба Халид, старший аналитик-исследователь Dubai Future Foundation в ОАЭ: «Ценность данных во многом зависит от того, какую информацию мы стараемся узнать, и в некоторой степени от того, в каком масштабе применяется эта информация».
Г-жа Халид сказала, что данные можно использовать для рационализации операций и повышения экономической эффективности (например, производитель самолетов компания Airbus сократила время доставки материалов поставщиками с пары недель до нескольких часов благодаря обмену с ними проектными и инженерными данными). Они также могут использоваться для создания новых предприятий, ориентированных на разработку специализированных продуктов (таких как Amazon, Netflix и Facebook), и совершенно новых отраслей и компаний, что иначе трудно было бы вообразить: примерами могут служить все отрасли, в которых используются данные, передаваемые спутниками, а также новая и развивающаяся область деятельности, точная медицина.
Ценность в денежном выражении и социальная значимость
Как показывают эти примеры, для создания инновационных продуктов часто необходимо объединять данные из нескольких источников, но определенные препятствия не позволяют реализовать эту ценность данных. По мнению Дайен Койл, профессора и специалиста в области государственной политики в Кембриджском университете в Великобритании, обмен данными не только необходим, но есть также аргументы в пользу того, чтобы некоторые данные оставались в свободном доступе. Данные имеют как денежную ценность, так и социальную значимость; последнее трудно измерить в денежном выражении, поэтому оно не всегда интересует частных инвесторов. По этой причине правительства уже давно предоставляют данные определенных видов, такие как национальная статистика, в качестве общественного блага. «Принимая определенные меры политики, можно добиться лучших результатов. Данные могут быть социально значимыми, но этой их ценностью не могут воспользоваться частные компании и отдельные лица», — сказала профессор Койл.
С ней согласились другие выступающие. Кэролайн Ванджиру Мучири из Центра права в сфере интеллектуальной собственности и информационных технологий Стрэтморского университета в Кении подчеркнула, что многое зависит от контекста. В некоторых африканских странах, например, предоставление государственных услуг зависит от доступа к данным, в то время как такие структуры, как религиозные и гуманитарные организации, располагают большими объемами критически важных данных. В некоторых странах определенную роль продолжают играть институты, унаследованные от колониального периода, и это имеет отрицательные последствия, такие как нехватка данных о женщинах.
Поскольку данные имеют наибольшую ценность, когда они целенаправленно собираются и накапливаются, Дзиро Кокурио, профессор факультета государственной политики Университета Кейо в Японии, задался вопросом, можно ли считать западные подходы, основанные на защите прав частной собственности, менее целесообразными, чем характерные для азиатских стран принципы всеобщего блага. Согласно этим теориям, данные следует считать принадлежащими обществу в целом, а не отдельным лицам, сказал он: «Нам следует ставить во главу угла гармонию и уважение, а не права и автономию отдельных лиц». Или, может быть, можно найти какой-то третий путь, в смысле доверия к тем, кто предоставляет исходные данные? «Нам нужно подумать о том, какой в идеальном варианте должна быть цифровая экономика», — сказал профессор Кокурио.
Структурированные и взаимосвязанные
По мере того, как наш цифровой отпечаток становится все более значительным, появилась необходимость накапливать огромные объемы данных («большие данные»); это обусловлено взаимосвязанностью устройств и снижением расходов на хранение данных, и этот процесс, вероятно, будет ускоряться. Как отметил Генеральный директор ВОИС Тан, 90 процентов всех данных в мире было создано за последние два года, и объем данных, генерируемых каждый день, в 2 500 раз превышает объем данных, хранящихся в Британской библиотеке. Однако этот огромный объем данных порождает определенные проблемы: как определить, какие данные релевантны и как обеспечить согласованность данных, справедливость и инклюзивность процесса, а также свести к минимуму факторы, снижающие эффективность обмена данными?
Как отметил процессор Койл, многое зависит от контекста: «Моя температура позволяет получить полезную информацию только в том случае, если мне известно среднепопуляционное значение». Медицинские данные могут быть весьма полезными для диагностики или прогнозирования заболеваний, но только тогда, когда они анализируются в сочетании с другой информацией. Некоторые данные могут оставаться полезными даже после их использования, а другие, например данные о дорожном движении или погоде, могут очень быстро терять свою актуальность.
Для того чтобы разобраться во всех подробностях данных с учетом контекста, эти данные должны быть надлежащим образом структурированы, чтобы при передаче они не становились менее полезными, и должны применяться процедуры, обеспечивающие их согласованность и совместимость. В своем выступлении Кунг-Чунг Лю, профессор права Сингапурского университета управления, предложил единый стандарт форматирования данных для более эффективного обмена ими, в том числе между странами.
Медицинские данные могут быть весьма полезными для диагностики или прогнозирования заболеваний, но только тогда, когда они анализируются в сочетании с другой информацией.
Данные с точки зрения регулирования
В процессе дискуссий о передаче данных и обмене ими возникают сложные вопросы о том, как данные определяются, классифицируются и регулируются. К ним относятся вопросы, касающиеся безопасности, этики, конфиденциальности, права собственности, и другие вопросы. Существует целый ряд региональных и национальных соглашений по этим вопросам. Многие из них также касаются основных прав.
Например, право на неприкосновенность частной жизни особенно актуально, когда речь идет о конфиденциальных или личных данных. С тех пор как появился интернет, в законодательстве уделяется много внимания защите конфиденциальности. Примером может служить Общий регламент ЕС по защите данных. Право на неприкосновенность частной жизни остается приоритетом для многих законодателей, что обусловлено опасениями по поводу нарушения безопасности, соблюдения конфиденциальности и потери контроля над личными данными.
В процессе дискуссий о передаче данных и обмене ими возникают сложные вопросы о том, как данные определяются, классифицируются и регулируются.
В то же время, как отмечает профессор Койл, если слишком много внимания уделяется конфиденциальности, «мы в большей степени рискуем упустить ценные возможности». Другие выступавшие согласились с ее опасениями. Необходимо найти варианты решения этой дилеммы. В частности, нужно обеспечить, чтобы данные использовались только для конкретной цели; для их использования в любых целях должно требоваться согласие; должны быть установлены такие принципы, как справедливость и достоинство; или, более того, на лицо, предоставляющее данные, может быть наложено соответствующее фидуциарное обязательство. Каким бы ни было решение, данные должны быть отслеживаемыми, чтобы можно было гарантировать их целостность.
По мере того как отдельные лица, бизнес и правительства стараются решать эти вопросы, стоит сделать шаг назад и рассмотреть преимущества использования данных. Как сказала в своем выступлении Дафна Файнхольц, руководитель отдела биоэтики и этики науки ЮНЕСКО: «Право — это кодифицированная этика, а технологии ИИ не являются нейтральными с точки зрения ценностей».
В ноябре 2021 г. Генеральная конференция ЮНЕСКО приняла Рекомендацию об этических аспектах искусственного интеллекта по результатам многосторонних консультаций и с учетом предложений государств-членов. Рекомендация включает 10 принципов, гарантирующих, что «при разработке и использовании технологий искусственного интеллекта руководствуются достоверными результатами как научных исследований, так и анализа и оценки этических аспектов». Рекомендация также касается конфиденциальности данных, совместного использования данных и управления ими и может послужить основой для продолжающихся дебатов о данных.
Как все это соотносится с правами ИС?
Большинство данных не вписывается в существующие нормативные рамки, такие как системы интеллектуальной собственности (ИС). Как сказал Брет Гривнак из Международной ассоциации по охране интеллектуальной собственности (AIPPI): «Права ИС защищают «творения разума», но большинство данных не имеют отношения к творчеству. Патенты могут защищать процесс использования данных или то, как они генерируются, но не сами данные, в то время как охрана авторских прав может обеспечивать защиту некоторых типов данных, но, как правило, только при наличии определенной структуры и при условии оригинальности данных. «Эти права ИС ограничены — альтернативой являются коммерческая тайна и договорное право», — сказал г-н Гривнак.
Коммерческая тайна представляет собой «гибкую систему», которая может защищать данные, сказала Элизабет Казнар Фекете, старший партнер бразильской юридической фирмы Kasznar Leonardos, добавив, что ей приходится иметь дело с «более точными контрактами», определяющими право собственности на данные и порядок их лицензирования, а также то, как балансируются права. «Нам необходимо создать интегрированные системы и модели взаимодействия между владельцем данных и теми, кто заинтересован в лицензировании», — сказала она. «ИС должна следовать динамике повседневного бизнеса».
Данные создают сложные проблемы для системы ИС. ИС может быть как стимулом для инвестирования в создание данных, например, наделяя правами на базу данных, так и препятствием для доступа к данным из-за ограниченных положений в отношении интеллектуального анализа текста и данных.
В ЕС с 1996 г. действует sui generis система охраны, обеспечивающая отдачу от средств, инвестируемых в создание баз данных, но необходимы значительные инвестиции в сбор и компиляцию данных, из которых состоят эти базы. «Может ли защита базы данных играть определенную роль в правовой охране данных, генерируемых при помощи ИИ в процессе интеллектуального анализа данных? Выполняется ли обработка путем создания или получения данных системой ИИ?» — спросила Татьяна Элени Синодину, доцент кафедры частного и коммерческого права Кипрского университета, которая пришла к следующему выводу: «Неясно, защищает ли закон такие базы данных».
Интеллектуальный анализ данных — процесс извлечения больших наборов данных — поднимает несколько сложных вопросов, особенно в тех случаях, когда задействованные данные охраняются или могут охраняться авторским правом. В некоторых странах, в частности в Японии, действуют широкие исключения из авторского права в целях интеллектуального анализа текста и данных, чтобы способствовать развитию ИИ. Однако в соответствии с законодательством США об авторском праве вопрос о том, разрешен ли интеллектуальный анализ данных, подпадает под общее исключение в отношении добросовестного использования. В ЕС применяется положение об интеллектуальном анализе текста и данных, которое позволяет проводить интеллектуальный анализ в исследовательских целях. Однако различие между коммерческим и некоммерческим использованием может быть недостаточно очевидным. Как сказал Карло Сколло Лавиццари, партнер в юридической фирме Lenz Caemmerer, находящейся в Базеле, Швейцария, «будущее считывания данных — это интеллектуальный анализ, а будущее интеллектуального анализа — контент, достойный такого анализа».
Заключение: ИС в контексте
Масштабы дискуссии продемонстрировали, насколько широкими и сложными являются вопросы, связанные с данными. В заключительной части совещания заинтересованные стороны из разных стран мира выступили с заявлениями по многим темам, в том числе о том, как система ИС может способствовать инновациям, основанным на данных, и интеллектуальному анализу текста и данных, о необходимости прозрачности, доверия и обеспечения правильного баланса между конкурирующими интересами. Стало очевидным, что эти вопросы имеют значение во многих отношениях и то, чем реально обеспокоены многие люди.
Диапазон высказанных мнений показал, насколько сложны проблемы, создаваемые данными для системы ИС. ИС может быть как стимулом для инвестиций в создание данных, например, благодаря тому, что она обеспечивает права на базу данных, так и препятствием для доступа к данным из-за ограниченности положений об интеллектуальном анализе текста и данных.
В ходе дискуссии было подчеркнута большое значение ИС и других соображений для регулирования данных. Хотя выполняемые ВОИС функции напрямую связаны с развитием сбалансированной и эффективной системы ИС, необходимо учитывать все остальные аспекты, чтобы обеспечить согласованный и последовательный подход к решению этих вопросов.
О дискуссии ВОИС
Дискуссия ВОИС — это крупномасштабный глобальный форум на тему ИС и передовых технологий. На нем высказываются различные мнения со всего мира и его цель – повысить осведомленность о проблемах, которые передовые технологии создают для ИС, путем обмена информацией и идеями, и помочь в разработке обоснованной политики.
Ежегодно проводится не более трех раундов дискуссии ВОИС. В них могут участвовать все желающие и они проходят в виртуальном формате, чтобы в них могли принять участие представители всех регионов. Записи обсуждений и краткая информация о них доступны на веб-сайте ВОИС. Следующий раунд дискуссии ВОИС состоится 5–6 апреля 2022 г. и на нем будет обсуждаться вопрос о том, как можно использовать передовые технологии для повышения эффективности управления ИС.
Выражаем благодарность Улрике Тилл, Отдел ИС и передовых технологий ВОИС
«Журнал ВОИС» призван помочь читателям улучшить свое понимание интеллектуальной собственности и деятельности ВОИС и не является официальным документом ВОИС. Используемые в этой публикации обозначения и представляемые материалы никоим образом не выражают мнение ВОИС относительно правового статуса каких бы то ни было стран, территорий или районов или их органов власти или относительно делимитации их границ. Данная публикация не преследует цели отразить точку зрения государств-членов или Секретариата ВОИС. Упоминание в публикации конкретных компаний или продуктов определенных производителей не означает, что ВОИС их поддерживает или рекомендует или отдает им предпочтение перед другими аналогичными компаниями и продуктами, которые в материалах не упомянуты.