MENU
媒体资讯

媒体资讯

聚焦之江实验室最新动态及媒体关注热点。

来源: 宣传文化中心  作者: 徐画  发布日期:2020-02-26

还在担心数据泄露?这把“保护伞”已替你撑好

在疫情防控的特殊时期,“隔空相见、云端开课”成为主流教学形式。在之江实验室,室友们早已拥有专属的“线上课堂”。由人力资源部牵头建立的“之江书院”,汇聚了之江学术堂、之江学术报告和之江沙龙等系列品牌学术活动的在线资源,帮助室友随时随地开展自主学习。

近期,之江实验室将整理发布部分“之江书院”课程内容,供人工智能和网络信息领域的研究者和爱好者学习参考。本期分享的是之江实验室“分布式人工智能算法平台”项目组负责人、浙江大学研究员吴超的讲座内容。什么是分布式人工智能?分布式人工智能如何破解传统建模方式带来的数据安全和隐私保护问题?让我们一块来听听吴超老师的分享。


应运而生,撑起数据“保护伞”

在机器学习发展早期,模型相对简单、参数相对较少,不需要很多数据。随着深度学习的出现,模型的效果往往需要海量数据作为支持。然而,大量数据分散在手机、传感器等形式多样、结构互异的边缘节点上,传统集中式人工智能对数据“先收集、再建模”的方式面临巨大挑战。

吴超表示,“隐私保护难、采集成本高、激励与定价体系不完善,导致数据难以获得。”因此,建立安全、可持续的数据生态成为分布式AI研究的首要目标。同时,吴超团队还确立了“增强模型能力”的研究目标。比如,提升泛化能力,让模型能力的迁移与融合更加高效;打造进化能力,让最优模型的自主构建成为可能。

在树立研究目标后,吴超团队很快确定了联邦学习这一研究方向。通俗来说,联邦学习描绘了这样一种学习模式:中心服务器将初始模型分发至边缘节点,终端用户利用自己的数据得到本地模型的更新,上述更新由中心服务器进行聚合,如此重复,直至得到想要的模型。


见招拆招,联邦学习“变形计”

吴超认为,虽然联邦学习在数据安全和隐私保护方面具有显著优势,被人工智能从业者寄予厚望,但现有的联邦学习仍存在两大问题。首先,联邦学习的中心节点承担了训练、分发模型的职责,这种中心化的建模方式会带来潜在的数据泄露、计算与通讯效率下降、维护成本上升等一系列问题。其次,现有联邦学习的模型聚合大多通过模型参数的平均或加权平均实现,无法处理分散在海量设备上的异构模型和非独立同分布数据。

为解决联邦学习带来的问题,吴超团队将研究重心聚焦于联邦学习的改造和优化。针对中心化带来的问题,吴超团队基于区块链技术构建去中心化的联邦学习:用区块链的智能合约替代中心节点,承担模型分发、聚合的功能。为防止“上链”后模型泄露,团队设计了差分隐私、同态加密等安全措施。

针对模型聚合,研究团队采用模型蒸馏的方法汇聚模型能力。最初,蒸馏是为压缩模型,将大网络的能力迁移到小网络上。而在这里,团队利用蒸馏来增强模型能力,聚合不同的本地模型以生成全新的模型。吴超介绍,“运用这一系列技术后,我们将传统联邦学习20%的准确率提升至65%左右。”

值得一提的是,除了在数据安全和高效建模等工作方面取得的突破外,吴超团队还着手开展了数据贡献和评价体系研究,力图让数据流动起来,以“更多的数据”训练“更大的模型”。此外,吴超团队在模型加速、模型保护等方面也做了积极探索,在优化模型结构、保护开发者的知识产权等方面取得了阶段性成果。


大有作为,AI实战“多面手”

据吴超介绍,分布式人工智能的研究工作是之江实验室“先进人工智能算法平台”的一部分,为上层的智能医疗、电商产品、艺术创意等课题提供底层支撑。

虽然许多工作尚在探索阶段,但分布式AI在一些领域已有不俗表现。其中,智能医疗领域的角膜病识别是分布式AI的典型应用场景。

由于角膜病成因众多,有细菌、病毒等多种致病因素,且每家医院的角膜病例有限,甚至可能只有单一类型的病例。在这样的限制下,各家医院训练的模型能力往往不强,而出于保护隐私的考虑,医院间又无法共享患者数据,传统的集中式建模难以奏效。分布式人工智能平台能为攻克这一难题提供解决方案,在保护患者隐私和医院核心数据的前提下,提升每家医院的模型能力。该项研究由之江实验室先进人工智能算法平台负责人、浙江大学计算机学院副院长、浙江大学人工智能研究所所长吴飞教授牵头开展。

此外,吴超团队还在无人机集群侦察、遥感数据的模型能力共享、城市管理与安防以及金融领域的多头贷检测等场景做出有益探索,让分布式人工智能技术更好地服务于科学研究和社会生活。

谈及研究分布式人工智能的初心,吴超表示,人工智能的未来难以预测,但是,“最好的预测方法就是去实现它”。研究团队期待,未来,每个人都有能力建模,并可以从建模中获得收益。在合理的定价和交易体系中,数据将自由流通,为构建更大、更优的模型提供源源不断的动力。

上一条:疫情之下 之江实验室引才亮新招

下一条:高兴夫:安全有序抓复工 全力推进之江实验室…

该内容仅限
内部人员查看

请登录