市北GMIS 2019:杨强用联邦学习打破数据孤岛,吴恩达谈企业转型

市北GMIS 2019:杨强用联邦学习打破数据孤岛,吴恩达谈企业转型

发布时间:2020-01-01 14:26      作者:秒速赛车开奖结果      浏览次数:241

  7月20日,「市北·GMIS」第二天更加精彩,杨强、吴恩达、俞凯等重磅嘉宾!继续带来了12场主题演讲,内容涵盖联邦学习、认知智能、、图表征神经网络等&#;前沿技术,同时AI应用侧的探索也异彩纷呈。

  在前沿技术方面,杨强教授分享了,如何用联邦学习,打;破数据割裂,吴。恩达谈到小数据、无监督学&#;习对未来人工智能发展的重要性,俞凯也抛出认知智能的技术演进路线。

  在AI应用方面,华为带!来从工程视角审视人工智能的新思路,阿里巴巴、美团展示了A、I在大规模场景!数据中的应用,周涛教授则呈现,AI社会治理与监管。方面的新研究。

  杨&#;强:用联邦学习打破「数据孤岛」

  作为今天大会的第一位开场嘉宾,微;众银行首席人工智能官、国际人工智能学会理事长、香港科技大学教授杨强、带来联邦学习的最新发展与应用,。

  AI发展到今天面临很大挑战,尤其是数据挑战。数据孤岛、&#;小数据、用户隐私的保!护等导致数据的割裂,让AI技术很难发挥出!价值。为了解决这一问题,杨;强教授提出「联邦学习」的研究方向。

  所谓联邦学习,是多个数据方之间组成一个联盟,共同参与到全局建模的&#;建设中,各方之间在保护数据隐,私和&#;模型参数基础上,仅共享模!型加密后的参数,让共享模型达到更优、的效果。

  杨强介绍道,联邦学习可分为横向联邦和纵向联邦,横向!联邦是指企业各方数据维度相同、、ID维度不同,更多存在。于消费者应用中;;纵向联邦是、指企业各方数据的I。D维度相、同(样本重叠)、数据维度不;同,更多存在于B端应用。

  在具体的使用场景中,杨强重点介绍了联邦学习在金融行业中;的应用。比如针对保险行业的个性化保险定价问题,一家互联网企业和一!家保险企业进行数。据合作,这种合作数据的ID重合度相当大,数据特征维度大大增加,使模型的个性化定价效果显著提升,为保险企业带来8。倍覆盖率提升和、1;.5倍利润率提升。

  在另外一个小微企业信贷管理!案例中,使用联邦学习!后,企;业,将风控区分度提升12%,使贷款不良率小于千分之五。

  即使在双方既没有共同的ID,数据特征也,不同的情况下,也可以使用迁移学习结合联邦学习进行共同建模。

  杨。强强调,联。邦学习一定是多方共同协作组成一、个联盟,生态的建设十分重要。它最大的优势是,保证数据不。出户,通过生;态在不同行业选取合作伙伴,用群体智能不断提升模型效果。

  未来,安全。合规、防御攻击、算法&#;效率!、联盟机制等都需要进一步研究。比如联邦学习中各方合作的一个基础就是加密技,术,加密算法的效率显得尤为重要,!算法的改善还有很长的路要走。

  吴恩达:利用AI带来的;动能

  深度学习先驱吴恩达(A&#;ndrewNg)是大家耳熟能详的名字,他的演讲也获得了最多的掌声、。今天,吴恩达!在GMIS大会上与人们探讨了企业的人工智能转型。

  「四年前我提出了一个概念:AI是新的电力。现在我得说,AI带来的动能正在展现效果,。」吴恩!达说道。「看看近年来有关AI的工作需求数量,!每年都有35%的增长,深度学习!的,发展正在让人工智能领域变得繁荣。。麦肯锡最近的预测认为到2030年,全球的经济增长量中将有1、3万亿美元来自人工智能技术的贡献。」

  「以机器学习领。域的论文数量为例,两个月前谷歌的。JeffDean曾展示了一个数字:arXiv上每天关于机器学习的论文数量超过100篇。」吴恩达表示。「今天,我们也有了很多机器学习,工具,包括神经网络框架TensorFlow、PyTor。c、h、MXNet和百度飞桨,这些工具!正在让人们使用机器学习的门槛变得越来越低。」

  吴恩达表示,几;个月前他曾在加州参加了一个创业&#;挑战:一支来自印度的团队展示了。机器人应用方法,其可以自动拍摄农田的照片。有趣的!是,开发这一应用的人只,有12岁——他使用开源的工具和算法完成了这一任务。现,在&#;的人工智能业务已经!可以由任何人来做了。

  通过足够的!数据和算力、&#;灵活的工具以及创新的想法、,我们可以建立起属于自己的AI项目。很多公司的CEO都在担心如何把AI技术加入企业工作流程中。这个转型过程,有时是。1-2年,或。是更长。他们担心选择了错误的项目、设定了不切实际的目标,如果转型、失败,公;司会蒙受巨大损失。

  「看看今天的世界,有关AI的应用越来!越多了。但企业的AI转型并不是开发一个APP这么简单。」吴恩。达表示,。

  去年&#;底,吴恩达发布了《AI转型,指南》,希望以教育者的身份将「AllinAI」的经验传授。给&#;众多公司管理者。作为AI领域的!先驱者,吴恩达从谷歌大脑;和百!度AI团队的发展中收集洞见,它们对谷歌、百度的AI转型扮演着重要角色。参照此指南,任何、企业都有可能成为强大的AI公司。

  ,为了找到正确的方向,我们需要从简单的地方起步,自动化、任务而非工作,并把人工智能和人类的专业知识进行结、合,这样才能更好地帮助公司选择正确的A,I项目。「我们发现,很多公司第一个落地的AI项目通,常并不是最有潜力的项目。我给很、多公司的建议是做一次头脑风暴,至少看六个不同的项目,」吴恩达表示。「然后花费几个星期进行!调研工作,确保这个项目是有价值的。」

  吴&#;恩达为企业AI转型给出了如下建议,在《AI转型指;南》中也有详尽解释:

  1.实行、试点项目获得动力

  、2.建立一支内部AI团队

  、3.提供广泛的AI培训

  4.,策划合适的AI战略

  ;5.建立内部和外部沟通

  在期待AI为企业带来的红利之前,我们还需要避免几个陷阱:不要期&#;待AI立刻产生作用、,而是要多。次尝试,对AI发展的回报曲线进行合理预算;不要使用传统的流程评估人工智能项、目,应该为AI项目团。队设立合适的K,PI和目标;在团队建设时,我们不能仅依靠。明星!工程师,而是要建立一个完善的团队。

  「看到AI崛起,我;们需要有正确的!概念,首先AI是一个系统的工程。我们需要集中很多人的团队才能完成一项具!体任务。」吴恩达表示。

  对于未来的人工智能发展,吴恩达认为,、我们应该期待能够利用小数据的新算法:「我们现在只能用人眼检测手机屏幕的划痕——如果有大量图片,AI也可以做得很好,但没有、任何工厂会有几百万不;同划痕的手机。这个时候我们就需要fewshotl;e、arning、无监督学习,等新方&#;法,能从很少的例子中学习出正确的概念。」

  强化学习和自我学习可以在虚拟环境中进行训练。,从而避免在真实世界的应用中遇险。而,且这些模拟可以并行化,同时进&#;行大量!的试。验,很快学习出解决方案。

  AI正在,走向端侧,区域计算中心也要承担部分计算,吴恩达对于5G有着、很高的期待。:「5G是非常重。要的技术,这项!技术在中国的发展已经超过了美&#;国。它能让网络延迟从4G的!20毫秒降低到仅仅1毫秒,并支持更多设备的连接。5G可以支持更多种类的应用,帮助AI发展出更&#;多新的形势。」

  认清人!工智能的极限

  在过去十年里,我们看到了人工智能的一;些真正突破,机器翻译这&#;样20年前仅存在&#;于科幻小说里的东西,现在已经成为全球数百万人每天都在使用的技术了,。同时我们还看到了很多令人兴奋的进展、,如人脸识别技术。在201,2年!时,吴恩达等人在谷歌的研究引领了图像识别领域的重大突破。

  「现在的计算机在识别面部方面比人类做得更好。所有这些使得;我们相信:我们;似乎拿到了人工智能魔法的配方,它就是深度学习。」牛津大学计算机系主任Micha。elWooldridge在大会上说道。「,看起来是这样、的,但进一步的探索之后。我们就会看到目前机器学习技术的尽头。人们都在问边界是什么,、我们现;在已经看到了。一些界限。」

  MichaelWooldridge向,我们介绍了人工智能目前的优势与限制。

  !计算机在1940年被发明出来的时候,被用来处理一些数学问题——它比人类做得好;,可以24小时不停地工作,人类。是做不到;的。

  但一些人类每天都在使用&#;的简单能力,机器学习却是做不到的——计算机无法进行长期,推理,无法做问题的定义,!难以对周遭环境形成认、知,,也难以完成可靠的判断。

  「你抽烟吗&#;?如果你每天抽;20支烟,得肺癌的几率会有很大提升。&#;这是一个简。单的推论,但对于计算机;来说是难以理解的。」Wooldridge表示。

  今天,AI最重要的问题在于认知能力—、—理。解周围的情况。。「这个技术关乎无人驾驶的可行性,我们可能会在未来的5、10或是30年后实现它,」Wooldridge说道。「自动驾驶归根结底就是让汽车知、晓周遭情&#;况&#;。深度学习在这方面已经,形成了很大的突破,但并未完全解决有关认知的;问题。」

  历史上,想要让AI进行推理,并展。现认知能力,人们找到了两种思路:

  ·自上而下的方法:基于专家知识&#;的AI——比如由人类教AI认识规则,从而让它学会如何开车。,但在规则太多的情况下,,我们仍然无法实现,可靠的认知,深度学习这种方法效果反而很好。

  ·自下而上的方法就是机器学习,通过数据的输入和判断的输出,通过大量已标注样本进行学习,不断更新模型权重,最终让计、算机学会概念,进而拥有判断的&#;能力。神经网络和深度学习!是目前流行的方法。

  由于算力限制等客观原因,深度学习方法在很长一段时间!内并不实用,而今,天,深度学习已经可以学会很多能力了。Wool、dridge举了!DeepMi;nd让AI打A,tari游戏的例子:在600次迭代之后,强化学习算法在没有人!类教学的情况下,通过自我训练学会了效率最高的得分方法。

  但基于数据驱动的方法也,有其极限,以法文诗歌的翻译为例,人类专家的翻译结果能够保、持优美,但谷歌翻译的机械结果显!然不尽完美。机器不能理解语言背后的意义,不懂法国文化。如果需要好翻译,计算机需要;看懂文字背后的深层内容。截至目前,我们不管把多少英。文-法,文。文本输。入到神经网络中,也无法获得像人类这样的理解。

  Wooldridge举了个更有趣的例子,机器学习也不、能理解这样的文字:

  -Bob:「Im;leavingyou.」

  -Ann:「Whoisshe?。」

  如果把这六个单词!输入谷歌翻译中,翻译成任何语;言,我们都能获得不错的直译结果,但机器是无法理解自!己在干什么的。「人类的学习方法!和机器是不同的过程。机器如果,要对语言有所理解,就要理解世界的一些常识知识。深度学习是一个很,大的突破,但这不是真正的AI。要想实现真正的智慧、,我们还需要更多。」Wooldridge说道。

  周涛:&#;一张街景照片引发的城市安全感分析

  作为国内大数据行!业启蒙导师之一,电,子科技;大学教授周涛呈现了在商业之外,。AI、大数据在社会治理和监管中的。真实应用。他抛出一个!独到观点:「未来社会治理和监管会有四方面的变化,自动化+规模化+定量化+客观化,AI、大数据将会发挥越来越大的作用。」

  围绕这一观点!,他介绍了AI、大数据在城市治理、,金融监管、环境治理等方面的真实应用。

  你很难想象,一张城&#;市街景照片可以跟社会治理产生关联。周涛教授的学生在北美一个城市,通过谷歌在十几万张照片中选择了2000张街景照片,然后。在网上通过志愿者做了一个简单的实验,看图回答你觉得这个地方是否安全,大约经过60天采集到了五十多万数据。然后将这、2000张图片排序,看哪些是!安全的,哪些是不安全的,把,排序映,射到0-1的空&#;间中去。再通过计算机进行特征学习,,对&#;看到的图片进行打分,结果表明计算机的打分和人类评分的关联性可达0;.87,这意味着很强的相关性。

  这一打分背后可以反映大众对城市环境的安全认知。同样地,计算机也可以对城市的绿化,水平、卫,生;条件、总体幸福、感等评分。&#;周涛团队在成都也做了一些类似的事情。通过计算机的评分,我们能够立刻知道一个城市哪里最安全、哪里幸福感最好、&#;哪里卫生条件最差等。

  另外,通过观察一个城市5年、;10年的城市发展照片,计算。机也。能从数据中呈现;城市&#;环境是否变好、、老百姓的幸福感有没有变强。这可以大幅改变!城市管理者对城市的认知,从而指、导政府的城市治理工作。大数据、机器学习技术连接了人类判断和机器判断。

  此外,周涛团队基于中小企业的行为数据为政!府提供金融监管平台,通过卫星!遥感数据在四川进行水质污&#;染的实时监、测。

  机器学习,的工程化视角

  在下午的「数。据思维与工程实践」板块,华为IT标准专利部。主任工程师黄之鹏另辟蹊径地分!享了AI、的工程化视角、。

  「我们提到机。器学习,经常会想到大数据;应用,但这次我希望介绍一下工程化!视、角(GAIA原则)的机器学习,」黄之鹏表示&#;。「华为希&#;望以通用性!技术来解决问题。在抽象的过程中,则希望有统一的接口。;我们希望所有的工作都能有很好的操作性、可解释性:写好一次代码,在其他任务中都可以应用。另外,机器学习最终的目的是自动化。」

  在开源领域里,华为一直在推动、全栈视角,真正的AI需要打通、全栈,实现端到端的人工智能工作流程,开发者不仅应该知道怎么用框架完成任务,还要知道模型跑在、不同的&#;环境里,需要如何简单地进行,转换。

  黄之!鹏着重介绍了近年来华为在开源社区ONNX中的贡献。在此前推理侧的模型转换!基!础上,机器学习社区正在!密集讨论模型训练的新方向。华为在这方面的贡献包括,边缘设备的通用方法,以及对于Mode;lZ;oo的算法贡献与方法提升。

  华为今年开始尝试推动开放异构计算框架(OHCF),实现端到端的开源全栈概念。对于厂;商来说,新的框架。是一个基准,对。于客户来说它也可以作为开发的参考。通过OHCF,我们可以实现面向专用!硬件的元数,据管理。

  「开源正在吃掉软件,其实也在吃、掉硬&#;件。对于我们来说,最重要的是把这些信息汇总到管理平。台上,形成更好的映射,更好地调用机器学习任务。」黄之、鹏表示。

  接着,阿里巴巴资深技术专家、阿里妈妈大数据和机器学习平台负责人张迪介、绍了深度学习与图、表!征神经网络在!淘宝广告。推荐中的超大规模应用。

  他说,「过去五年中,以深度学习为代表的&#;AI技&#;术在CV领域取得巨大成功,但对于很多大的互联网公司来说,占公司内部80%以上算力的应用还是搜索、推!荐、;广告,它们是沉默的大多数应用。」

  用户在淘宝上的行为是非常复杂的,包括浏览、收藏、购买等,电商广告面临的挑战是如何洞察用户的兴趣习。惯,推!荐个性化!的产品。而随着深度学习的、引入,网络变得越来越复杂,新的挑!战是,广告推荐场景以特征为主,一方面高维稀疏特征导致模型非常大,往往达数百G甚至上T规模!;另一;方面,相比CV场景,广告推荐场景在参数规模、样本规模上都要大一两个数,量级,参数通常达千亿规模,、样本通常达千亿到万亿规模,所以必须要做一个全局设计保证计算芯片高效率运行。

  阿里打造了高维稀疏。场景的深度学习框架,并提供非、常多的训练模秒速赛车开奖结果式,进,行分布式模型存储等,进而优化推荐模型,比如推荐场景下使用的结构化训练范式可将训练性能提高4~5倍。

  张迪还谈道,淘宝上的商品、店铺、品类等本身就、是,一个超级大图,用户的购买行为构成了大图之间的连接,所以电商人货场匹;配的场景非常适合用大规模图表,征学习进行刻画。

  它可以!对图中的深、层次关系进行更。动态地刻画,比仅仅使用深度学习有更好的可解释能力。以CTR点击率预估为例,使用分布式图表征学习后,可以把表征做的。更加深入,并且整个系统更加简,单。

  他总结道,使用图表征学习和深度学习结合有两个优点,第一是使输入的样本大幅度减少,另一个是在对整个历史用户行为&#;进&#;行刻画时可以动,态地进行表、征学习。

  美团和;大众点评每天在全国都会有60万骑手把商品递送到消费者手中。美团大众点评智能搜索团队负责人张、弓介绍了搜索智能、化的落地和相应系统建设:「与通用搜索和电&#;商搜索不同,美团点评的生活服务搜索会遇到不同的挑战。当用户搜索日本料理、的时候,我们是给他推荐一个近距离的商家,还是距离稍远,但是更高端的呢;?」

  搜索不仅是一种完成用户需求的服务,也是一个天然的大数据系统!,美团点评构建了支,持海量离线数据的处理能力,使用在线学习方法实时感知用户需、求的变化。「通过大数据处理框架的开,发,我们建设的搜索系统架构支、持异构数据,支持复杂模型。智能数据的处理是非常!重要的。」张弓介;绍道!。

  目前,美团点评已有4亿用户、千;万级POI、1.4亿。店菜、数量高达40亿的真实点评文本,这些数据可以用来构建知识图谱,从海量数据中学习知识。张弓表示:「我们构建了美团大脑,这是一个知识提炼,框架。我们在构。建的过程中发、现这和人类社会的科技进化史方法很相似:通过大数据(原料),我们可以提炼出知识(金属),进而构建模型(工具与组&#;件),最后打造出高科技的产品——飞机、火车等等。」

  这样一套框架可以帮助美团源源不断地产出各种丰富的显性和隐!性知识。!美团最终希望打造一,个一站式的全场景搜索需求,构建面向消费者的智能,助理,帮助消费者吃得更好、玩得更好。

  传统汽车交易链条很长,具备不确定性,;导致交易的复&#;杂性。车好多集团高级算法专家王文斌分享道,车好多围绕「人、货、彻探索了不同的智能化。应用,比如车况智能评估、,智能定价等。今天他重点介绍了公司;在对话机器人领域;的探索。

  对话机器人可以连接企业和用户、,一方面它,降低了人力和培训成、本,使服务;质量可控,提升效率,另一方面它通过推荐系统和多轮对话,引导用户完善用户画像,实现精准营销。

  对;话机器人最核心的是两个方面,理解用户意图,然后给出回答。车好多。基于底层的NLP技术,结合汽车领域的数据,开,发出了意图识&#;别、智能导购、对话辅助等,来支持相关业务的开展。

  王。文斌认,为多轮对话是个工程问题,需要从填槽、场景管理、可配置上进行优化。此外他还谈到,在具体业务场景中,产品与算法的平衡、业务和技术的平衡等都是对话机器人。所;面临的挑战。

  产业的重生与变。革

  !在最后一个板块「智能应用与产业生态」中,如何定制对话式语音助理、AI在零售和教育;的落地成为关注点。

  思必驰&#;联;合创始人、首席;科学。家俞凯谈道,「技术提供商的通用技术和高度灵,活个性化应用的需求往往成为主要矛盾。」

  、为此,思必&#;驰提;供可定制的对话式人工智能平台。他称;这样一个平台,必&#;须要具备工程、(模型)资源、(个性化)算法三方面的支撑。

  在工程支撑方面,语;音助理必须以对话为核心,做到!高可用定制、定制规模!化,此外还要做到软硬件一&#;体化,提供智能信、息服务。

  在资源支,撑上,针对语音识别、理、解、表述、合成等方面,需要有自动化的技术,实现定;制化的识别,并扩展相应的。语!义理解。

  在算法支撑方面,个性化自适应算法要解决三个难点问题,首先要能够智能检测,发。现目标;通过小数据迁移学习,、通过语意槽的共享,迁移到不同的应用场景;还要具备在线自适应试错学,习,,基于试错的强!化学习解决对;话交互策略,问题。

  俞凯还指出对话层面的认知智能技术路线,即从深度学习演进!到迁移学习,由数&#;据驱动变为数据和知识混合驱动,由需要预先搜集数据的开环学习转变为闭环学;习。

  码隆科技联合创始人、首席技术官MattScott向我们介绍了人工智能技术近期在零售领域的发展:「我&#;们现在处于零售的重生阶段,而不是零售的启示录阶段。零售业公司!不、会全部变成电商,但、在演进过程中必然会。有转型;,这就是我&#;们需要用到AI零售的地方。」

  有关新零售这个主题,我们已经看到了太多PR内容,什么是真正、的零售AI?Scott认为,我们谈论的首&#;先是数据,其次是算法,我们需要无监督学习&#;/!弱监督学习处理大量、数据。

  对于零售商来说,他们需要的是可扩展的、&#;有真实效益的解决方。案。零!售在真实世&#;界中总会遇到各种各样的问题,AI必须解决这些问题,否则无法实际部署。另一方面,零售行业的,利润率非常低,在、成本效益上,新的方法必须达到很好的效益。

  「我们不能为高科技付出太!多的;成本,我们不能放太多的摄像头,有太多的设备要、求,这是无法扩展的,」Sc。ott表示。「比如自动化的购物体验,它还有很长的路要走,在大店模式上难以!实现,目前只适用于小店。」

  在超市自,主称重的。问题上,我们现在可能需要,在商品列表,中翻好几页选择正确的种类才能算钱&#;,如果我们;为这个系统加入一个摄像头,使用AI自动识别商品,问题就能很快解决了。Scott表示!,使用码隆科技的技术,即使被装在袋中的水果、,摄像头之后的算法也能快速识别,准确率超过99%。

  在这背后的算法也很重要,码隆科技立足于科技领先的研究。「大多数人都关注;AI的架构和数据,码隆科技则关注损失!函数和学习策略,我们发现这可以极大提升算法的,识别效果。」Scott表示。

  码隆科技推出的弱监督学习算法。CurriculumNet在一些任务中、实现了业内最,佳的效果。论文已经被ECCV2018大会收录。而、在GPWFramework的研究中,码隆已经可以对比所有损失函数的。优缺点,新的研究已被CVPR2019大会接;收。

  暗物&#;智能深耕的场景是,AI+教育。其研发总监梁小丹称,暗物智能从技、术上搭建了五层的AI认知架;构,第一层是执行交互层,第二层是;感知和行!为层,第三层是任务与调度层,第四层是思维;与动机层,第五;层是价值和规范层。

  它具备语音交互、计算机视觉、逻辑处理等!多模态能力,并研发了一款桌面陪伴机器人。

  暗物智能还通&#;过学习教育机。构的视频,自动生成背后的教学逻辑,训练AI老!师。在智慧课!堂场景中,它通过分析老师,与学生的对话交互,判断老师有没有把某个知识点教会学生,以及。学生对哪个知识点掌握得较为薄弱,进而进行个&#;性化AI辅导。

  最后,黄之鹏、俞;凯、MattScott、梁晓丹和WonderTechnologies首席数据!科学家Chr;istopherDossman共同围绕AI应用创新与挑战进行了一场圆桌对话。

  「在未来十年可解释的AI是最重要的、方式,只有可信的AI才能够推广到各类领域中。」,俞凯表示。

  MattScott则认为目前我们仍然处在AI技术;发展的开始阶段:「当今的。人工智能研究还有一些。基础的问题未被攻克。机器学&#;习无;法学会人类学习经验的方法,我认为结合多种感官输入的多模态算法将会是未来AI的重要;发展方向。」

  广;告

秒速赛车开奖结果

秒速赛车开奖结果科研集团

邮箱: desdev@vip.qq.com

地址: 山西省汾阳市高新开发区沂河路198号

电话: 0910-0588823

传真: 0910-0588823

备案号: 琼ICP备37619791号-1