隐私、机器学习和人工智能间的相互作用
Ben Lorica访谈,O’Reilly Media首席数据官
技术趋势报告指出了AI研究的当前趋势,您认为目前是什么在推动创新?
硬件和机器学习领域,尤其是深度学习和强化学习方面取得突破,让人们重拾对人工智能的兴趣。上述两种学习方法都是众所周知的数据密集型技术,生成或收集(标记)数据来训练这些算法的重要性不容小觑。
这是一个数据隐私已成为用户和监管机构的核心问题的时代。用户要求数据的收集、存储、使用和共享方式更加透明、对它们的控制更加严格。
Ben Lorica
这是一个数据隐私已成为用户和监管机构的核心问题的时代。用户要求数据的收集、存储、使用和共享方式更加透明、对它们的控制更加严格。许多地方的监管机构已经出台具有里程碑意义的数据隐私法规,例如,欧洲(《通用数据保护条例》(GDPR))和加利福尼亚州(《加州消费者隐私法案》)已经将透明度、“用户控制”和“隐私设计”等概念放在了想要部署数据产品的公司的首要位置。
在这个数据隐私已变得至关重要的时代,各组织如何将数据分析构建到服务中?
一般的组织使用数据主要进行两大活动:改进决策(通过商业智能)或实现自动化(使用机器学习和AI)。事实证明,有一套新兴的隐私保护方法和工具可用来搭建基于商业智能和机器学习的系统。
在许多情况下,商业智能依赖于数据库。优步(Uber)与加州大学伯克利分校的Rise实验室合作,推出了一个开源工具,可以让分析师提交查询并获得基于最前沿的差分隐私(提供可靠隐私保证的正式担保)的结果。他们的开源工具为许多组织内部保护隐私的商业智能铺平了道路。更让人眼前一亮的是,差分隐私可覆盖数百万台实时生成数据的设备。苹果、微软和谷歌已经为手机和智能仪表的支持服务构建了保护隐私的商业分析。
研究人员和企业家正积极地为AI搭建隐私保护方法和工具。机器学习界早就承认,简单的数据匿名技术会给用户隐私带来风险(早期的例子有针对Netflix大奖赛的反匿名攻击)。以下是机器学习中的几个最新隐私保护技术:
- 联合学习:由Google推出,允许在不共享数据的情况下训练集中式机器学习模型,因此非常适合移动设备上的服务。.
- 差分隐私: 差分隐私和机器学习之间的相互作用仍是热门研究领域,研究人员开始研究基于差分隐私的深度学习模型。
- 同态加密:密码学技术的新兴领域,其目标是开发一类能在加密数据上计算复杂模型的工具。在计算机视觉和语音技术方面已完成初步工作。
- 去中心化:此领域主要由希望使用区块链、分布式账本和基于加密货币的激励结构的初创企业推动。例如,Computable Labs 实验室正在搭建开源、去中心化基础设施,使公司能够安全地共享数据和模型。他们希望“使区块链网络与机器学习计算相兼容”。
由于用户和监管机构都强调数据隐私公司的重要性,数据界正集合起来,为为期不远的AI系统搭建隐私保护工具。