新闻中心 新闻中心
Image 首页 资源中心新闻中心 微众银行&极视角AAAI2019会议正式发布联邦学习应用合作

微众银行&极视角AAAI2019会议正式发布联邦学习应用合作

Image 2019-02-14 00:00:00 Image 来源:极视角科技 Image 浏览: Image 极视角动态

    近日,国际人工智能领域最为权威重要的学术会议之一,第三十三届AAAI人工智能顶级会议(AAAI-19 The National Conference on Artificial Intelligence)在美国夏威夷举行。


    AAAI 由#国际人工智能协会AAAI#主办,每年都会吸引来自全球各地的学者参会,是研究人员和科学家展示他们在人工智能领域的研究和新思考的平台。而其中,中国学术力量正扮演着越来越重要的角色。



    本次会议上,国际人工智能学会理事长,微众银行首席人工智能官(CAIO)杨强教授作为特邀演讲嘉宾,发表了主题为「GDPR、数据短缺和人工智能」的特邀演讲(AAAI Invited Talk),全面讲述「联邦迁移学习」的安全的分布式建模原理和在数据合规上的意义。


    其后,杨强教授及其团队正式宣布 #微众银行# 与 #极视角# 建立战略合作伙伴关系,极视角成为国内首家将「联邦学习」应用于计算机视觉领域的AI公司。同时,微众银行首次发布了基于联邦学习的「联邦AI生态系统」(Federated AI Ecosystem),同时开源「联邦AI解决方案」FATE(Federated AI Technology Enabler)。正式面相全球企业及开发者,开启FL技术新征程。


▌杨强教授关于联邦迁移学习演讲现场


     那么,到底什么是「联邦学习」?它又有什么意义?


    无论从国家政策或市场导向而言,人工智能其技术及商业地位在全球范围内已不容置疑。近几年,谷歌、微软、百度等科技互联网巨头对AI的创新与布局,更是将这轮智能化狂潮推向大众。从金融安防到零售医疗……AI开始真正成为人们社会生活的一部分。


    我们正迈向未来,时代的发展却并不会一蹴而就。人工智能面世的近60年里,曾因算法、算力和数据缺乏历经两次低潮,如今在「大数据」「云计算」支撑下的新一轮发展高峰虽已到来,实际情况却并不如人们想象中那么乐观。



    技术上我们仍处于弱AI阶段,无论是前期的算法开发还是后期的优化迭代,都需要通过大量的数据收集与训练完成:人工智能对场景和数据的依赖极大,数据获取却愈发困难。 主要体现在以下两个方面。


    首先,数据孤岛现象严重,利用率差成本高。定向数据的收集与标注本就是个去芜存精的过程,需要排除大量无用与低质量数据,要采集到足够的有效数据,其难度与成本不是每个公司都愿意或有能力负荷的;另外从数据资源分布来看,大量行业数据只掌握在少数企业手中,或零散分布在不同企业,考虑到竞争与利益关系、数据隐私等,数据很难共通,孤岛现象十分严重。


    另一方面,数据安全与用户隐私问题愈被看重。随着企业间的数据争夺战愈演愈烈,数据市场的竞争与交易开始逐步走向规范,监管也愈加严格,数据互通愈发困难。


    如欧盟在2018年5月25日正式实施了史上最严的个人数据保护条例GDPR(通用数据保护条例),法案强调,机器学习模型必须具有可解释性,而且对于收集用户数据,必须公开、透明,用户可以要求经营者删除其个人数据并且停止利用其数据进行建模。


    2019年1月21日,谷歌公司就成为依据此法遭高额处罚的首家美国科技公司,被罚款5000万欧元。


▌杨强教授演讲胶片


    要解决以上两个问题,就需要用到「联邦学习」。


    「这样的大环境下,下一步人工智能的重点会从以 AI 基础算法为中心的导向,转移到以保障安全隐私的大数据架构为中心的算法导向上。」(杨强教授语)


    传统的「机器学习」一般在单机或者集群上集中处理数据、训练模型。像我们常说的「云计算」便是把各自的数据聚到一起,通过远程的处理能力来产生结果,再把结果下载到本地加以使用。


    这样的处理方式十分有效,但显然并不适用所有场景。对例如金融、家庭、智能驾驶等对数据隐私性或处理速度要求较高的场景而言仍未达到要求。


    「联邦学习」的突破则在于,它将机器学习的「模型训练」和「云端存储」二者成功解绑,所有训练数据留在企业本地,上传的只是模型的变更部分。此外,系统还会将所有企业上传的模型差异做平均化更新,以改善共享模型,改善后的模型企业可立即使用。从而数据隐私与处理速度得到了保证。


▌A.本地化的模型训练  B.基于大量用户的模型改进融合为共享模型   C.不断重复,完善共享模型

「联邦学习」(也翻译为联盟学习/联合学习)可以理解为一个数据联邦,联邦内各企业身份地位相同,无须进行数据移动或互通,而是通过某种加密机制进行参数交换,从而建立一个虚拟的共有模型,让彼此都能获得模型效果的提升。


「极视角」与「联邦学习」


    近几年,基于AI计算机视觉领域,极视角现已合作零售、地产、安防、医疗等30多个行业,企业300多家。在长期的企业调研与算法开发过程中,由于企业场景数据缺失/低质等造成的开发&优化困难已不是常事。


    如今,极视角首次将「联邦学习」引入计算机视觉领域,它能辅助优化现有图像识别领域70%的算法应用。


    对于当下面临图像识别数据困境的企业主而言,它能有效帮助企业扩宽数据应用范围,共享数据模型成果,直接在终端实现算法模型的自动优化。进一步降低各企业对AI技术的使用成本与数据门槛。


    对于开发者而言,开源的FATE为开发者提供了所必须的多方协同建模工作流管理、加密机器学习工具库和并行计算基础设施抽象三层能力,同时提供了很多开箱即用的联邦学习算法和联邦迁移学习算法供开发者参考,极大简化了联盟AI开发的流程并降低了部署难度。


▌A.杨强教授讲述微众银行与极视角的合作意义


    系统预计在2019上半年上线,届时极视角将会有5~10个算法抢先上线,这些算法将在系统中自动实现模型训练—模型优化——反馈使用的闭环。

- END -
找算法上极视角!