硬件和机器学习领域,尤其是深度学习和强化学习方面取得突破,让人们重拾对人工智能的兴趣。上述两种学习方法都是众所周知的数据密集型技术,生成或收集(标记)数据来训练这些算法的重要性不容小觑。
这是一个数据隐私已成为用户和监管机构的核心问题的时代。用户要求数据的收集、存储、使用和共享方式更加透明、对它们的控制更加严格。
Ben Lorica
这是一个数据隐私已成为用户和监管机构的核心问题的时代。用户要求数据的收集、存储、使用和共享方式更加透明、对它们的控制更加严格。许多地方的监管机构已经出台具有里程碑意义的数据隐私法规,例如,欧洲(《通用数据保护条例》(GDPR))和加利福尼亚州(《加州消费者隐私法案》)已经将透明度、“用户控制”和“隐私设计”等概念放在了想要部署数据产品的公司的首要位置。
一般的组织使用数据主要进行两大活动:改进决策(通过商业智能)或实现自动化(使用机器学习和AI)。事实证明,有一套新兴的隐私保护方法和工具可用来搭建基于商业智能和机器学习的系统。
在许多情况下,商业智能依赖于数据库。优步(Uber)与加州大学伯克利分校的Rise实验室合作,推出了一个开源工具,可以让分析师提交查询并获得基于最前沿的差分隐私(提供可靠隐私保证的正式担保)的结果。他们的开源工具为许多组织内部保护隐私的商业智能铺平了道路。更让人眼前一亮的是,差分隐私可覆盖数百万台实时生成数据的设备。苹果、微软和谷歌已经为手机和智能仪表的支持服务构建了保护隐私的商业分析。
研究人员和企业家正积极地为AI搭建隐私保护方法和工具。机器学习界早就承认,简单的数据匿名技术会给用户隐私带来风险(早期的例子有针对Netflix大奖赛的反匿名攻击)。以下是机器学习中的几个最新隐私保护技术:
由于用户和监管机构都强调数据隐私公司的重要性,数据界正集合起来,为为期不远的AI系统搭建隐私保护工具。