2020 北京智源大会首日精华速递

智源社区

于 2020-06-22 21:38:36 发布

阅读量622

点赞数

文章标签：人工智能神经网络大数据机器学习深度学习

2020年的「6 . 21」，有很多人在45°仰头狩猎日环食，错过等十年。

这一天也有许多人盘坐网线一端，咀嚼一场内行人的AI盛宴，错过等十年。

在全球抗击新冠肺炎疫情的特殊时刻，父亲节当日，日环食嗨遍全国之际，由北京智源人工智能研究院主办的“2020 北京智源大会”在 6 月 21 日开幕，为期 4 天，通过视频连线全球范围内人工智能领域的 100多位顶尖专家学者，共同探讨未来十年人工智能的发展走向。

想要把握 AI 未来十年的发展走向？

走，随我们一起到智源大会上寻找答案。

在这篇文章中，我们筛选了 21 日智源大会中演讲嘉宾的部分亮点，挂一漏万，抛砖引玉。

正如我们在会前的「参会指南」中所说，

在这场“头脑风暴”中，你或许有一闪而过的灵感，或许在纸/电脑上留下了丰富的笔记，或许某场演讲让你激动不已——记住，会议的结束只是你收获的开始。请对这些信息进行二次加工，梳理关键信息，重新演绎idea的完整逻辑；如有可能，也可以邮件联系演讲嘉宾，以便跟进或加入他的后续研究。

——首日全体大会——

1. 从基于数据的大数据革命，到基于科学的因果革命

Judea Pearl，图灵奖得主、贝叶斯网络提出者

主题：The New Science of Cause and Effect with reflections on data science and artificial intelligence

如果有了反事实和条件独立两条基本定律，我把它称为因果推理的双螺旋，那么你可以推演出所有的因果工具。

理解因果推理需要抓住一个窍门，那就是区分 seeing 和 doing 的不同，一个简单例子就是某个便利店中”观测到某商品的价格翻倍“和“店主强制让某商品价格翻倍”有区别。

基于因果科学，成百上千个曾经被认为不可能解决的问题，现在可以用简单的数学和可行的算法来解决。

2. 从数据中提取价值，从安全、鲁棒性中造福社会

周以真，哥伦比亚大学教授、数据科学研究院院长

主题：Data for Good: Ensuring the Responsible Use of Data to Benefit Society

如何使用数据造福人类社会：周以真教授认为可以从如下三个角度着手：

(1)提高数据科学的研究水平；

(2)通过应用数据科学改变所有的领域、专业及部门；

(3)确保以负责任的方式使用数据造福社会，比如考虑人工智能的安全性和鲁棒性等。

3. 用领域知识，突围深度学习

Ruslan Salakhutdinov，CMU教授

主题：Integrating Domain-Knowledge into Deep Learning

如何更好地将领域知识融入深度学习之中？Ruslan Salakhutdinov 教授提出了一个 Knowledge Base (KB) 模型来解决在合并结构领域知识的过程中遇到的三方面障碍：异构数据（Heterogeneous Data）、推理和弱监督。参透下图，所有奥妙将了然于胸！

——人工智能的数理基础——

1.两行代码，改变 GAN 的全局最优特点

孙若愚，University of Illinois at Urbana-Champaign

主题：Towards Better Global Landscape of GAN: How Two Lines of Code Change Makes a Difference

GAN 优化是一个非凸非凹、minimax 的目标优化，这让优化器非常容易陷入局部最优当中。

孙若愚等人提出了一种新的 GAN 模型 RS-GAN（Relative Standard GAN），避免局部最优。相较经典GAN，只需修改两行代码。

2. 数学证明了，神经网络也避免不开这个困境

Johannes Schmidt-Hieber

Professor of statistics at the University of Twente

主题：Overparametrization and the Bias-Variance Dilemma

神经网络过参数化却仍具有很好的泛化性能（如下右图）：在 new regime 区域，是否存在下限呢？也即以神经网络为代表的机器学习算法能否避开 Bias-Variance 困境？Johannes 的回答是：存在一个普遍的下界，任何算法都不可避免。

3. 当数学家开始研究 GAN 时，你发现好像从没学过

戴彧虹

中科院数学与系统科学研究院研究员、智源研究员

主题：Optimality Conditions for Constrained Minimax Optimization

没有严谨的定义，就没有严谨的应用。戴彧虹等人考察了 GAN 的数学描述，发现其根基不牢，于是基于 Michael I. Jordan 等人的工作，提出了受限条件下的minimax优化定义。这让人联想到：没有数学家加工过的人工智能，只不过是工程，而非科学。

4. 旧“工具”换新颜：因果推理的工具变量提高算法可解释性

林伟

Assistant Professor of Peking University、BAAI PI

主题：Instrumental Variables for Multiple Causal Inference: Old and New

2000年 Pearl 为了估计模型的因果关系，推出“工具变量”（IV）的概念。但经典IV要求严格的有效性假设，迁移到现代的机器学习场景，难以成立。林伟提出新方法，放宽假设，从而在IV框架的基础上，提出多种方法，来提高 AI 算法的可解释性。

——智能体系架构与芯片——

1. 软、硬分离，成就了计算机，能成就 AI 吗？

张悠慧，清华大学计算机系研究员

主题：软硬件去耦合的类脑计算系统设计与思考

传统计算机的迅猛发展，关键一点便在于“软硬去耦合”，即：软件开发不用考虑硬件；硬件开发只要做到向下兼容，也完全可以不考虑软件。张悠慧教授提出一个大命题：类脑计算系统设计中，是否也能“软硬件去耦合”？

答案尽在一图中：当然可以。

张悠慧教授在神经网络模型和神经网络芯片之间加入中间层；围绕三个层次，张教授近年来发表一系列相关研究。

张悠慧教授认为，传统计算机能够做到软硬解耦的关键基础在于图灵完备性，若想做到类脑计算的软硬解耦，证明其完备性迫在眉睫。

2. 去中心化分布式训练系统

钱学海，南加州大学电子工程系助理教授

主题：去中心化分布式训练系统

随着深度学习在众多领域的成功应⽤，快速和⾼效的模型训练越来越重要。为了获得⾼准确率，模型大小和训练数据都⽇益增加，分布式并⾏训练成为不可或缺的技术。

当前流⾏的机器学习系统⼤都采⽤中心化和同步的并⾏训练，造成了通讯的瓶颈并容易受异构运⾏环境的影响。针对这个问题，钱学海提出了有效的去中⼼化分布式训练的系统设计⽅法。对同步执⾏，他们利⽤执⾏状态差别和通信图的关系，设计了系统资源控制的同步协议。对异步执行，他们提出了⼀种新的通信原语和有效的避免系统等待的⽅法，基于它们实现的系统有效的消除了通信瓶颈并达到和当前集中式训练相当或更好的性能。

3. 智能超算为什么需要基准测试程序？

陈文光，清华大学教授、智源研究员

主题：智能超算基准测试初探

用超算解决 AI 应用程序越来越流行，但怎么评估一台超算运行 AI应许的能力呢？没有基准测试，就难以指导下一代超级计算机的设计、研发和部署。可以说，基准测试程序不完全是芯片体系结构的部分，但却非常重要，会对一个领域发展起推动或者引领作用。

当前，传统HPC Benchmark领域的若干经典评测标准已经很难有效评价高性能计算机运行人工智能应用的计算能力；而当前面向人工智能领域的评测程序，主要针对小规模系统的评测，并不能对超大规模系统进行有效评测。

陈文光等人提出了一种以神经网络结构的自动发现与参数调优（AuToML）为基础，计算规模可变的人工智能算力评测方法和评测方法。

4. 用忆阻器，做真的神经网络

杨玉超，北京大学研究员、智源青年科学家

主题：非线性忆阻神经网络

摩尔定律所带来的计算性能提升日益放缓，基于传统器件的冯诺依漫架构面临存储墙、功耗墙，难以满足人工智能和后摩尔时代日益增长的计算性能需求。因此有必要进一步提升算力需要的新器件（忆阻器等）、新架构（类脑等）作为新的驱动力。

所谓忆阻器，即记忆电阻器，从名字就可以知道，这种电阻器带有一定的记忆功能。杨玉超在报告中介绍了神经元与突触均基于忆阻器的全忆阻器神经网络与硬件系统，该系统能够充分发挥神经形态器件的优势，优化神经网络的智能处理水平与能效，并在多种智能任务中获得演示验证。

5. 真存内计算的自动综述方法

罗国杰，北京大学长聘副教授、智源研究员

主题：真存内计算的自动综合方法

称摩尔定律即将失效的声音每一年半涨一倍，但集成的复杂度还在持续提高。随着集成度的提高，数据移动开销问题越发凸显，特别是在大数据应用程序中，往往会是FP计算本身的200倍以上。

解决办法除了存储分层之外，当然是存内计算——在存储芯片中加入一些处理单元。近年来，基于RRAM等新型非易失性存储的存内计算已经成为解决冯诺伊曼瓶颈的重要途径。

罗国杰副教授从设计自动化的角度，提出了面向存内计算的自动综述和映射技术。并分别从RRAM状态逻辑和模拟计算的综述流程做了相应的改进。

6. 怎么做到的？国科大五个本科生，四个月开发一款处理器核

包云岗，中科院计算所研究员、智源研究员

主题：开源RISC-V处理器核COOSCA的敏捷设计实践

以RISC-V为代表的开源硬件影响力已经从学术界扩展到社会各界。受智能物联网的需求碎片化需求、人才驱动力、降低芯片设计门槛推动产业变革等三方面的影响，开源芯片产业蓬勃发展，同时对处理器芯片敏捷设计平台的需求也日渐强烈。

中科院计算所包云岗研究员于是在教学实践中以RISC-V为基础，利用Chisel开发语言，创建了一个面向对象体系结构的乐高积木式的芯片设计平台。

在中国科学院大学开展的“一生一芯”计划中，5位本科生利用在指导团队支持下用20人月完成的一款64位RISC-V开源处理器核COOSCA 1.0。基于COOSCA核的SoC于2019年底流片，目前返回样片可加载Linux并运行用户应用，成功实现“一生一芯”计划目标——让本科生带着自己设计的处理器芯片毕业。

7. 百度昆仑——灵活的AI处理器

欧阳剑，百度智能芯片总经理

主题：百度昆仑—面向多样应用的AI处理器

AI有非常多样化的应用，例如语音，图像和自然语言处理，因此在应用开发时，需要设计足够灵活的AI处理器来计算多样化的应用。

百度昆仑是百度设计的第一款AI处理器，基于XPU架构（百度于2017年在HotChips会议中发表），采用14nm工艺实现，内存带宽512GB/s, 计算能力达到260Tops。

据欧阳剑介绍，在多种实际的模型中，百度昆仑皆取得了非常好的性能，例如Bert、Transformer、YoloV3和Resnet50上，比T4 GPU有1.5x~2.0x的性能提升。

——AI科技女性论坛——

1. 叫我带头人，而不是女性带头人

季姮，美国伊利诺伊大学厄巴纳香槟分校（UIUC）教授

报告主题：叫我带头人，而不是女性带头人

女性研究者，在学术领域承担更多的社会工作，在学术会议等场合勇敢发声并积极的负责各种组织工作，成为论坛的主席和演讲者，积极参与各类交流活动。不要等待变化发生，而要成为变化的一部分。

女性学者可以有更多的选择权力。如何着装、怎样讲话、外表如何，工作与生活如何平衡，都是女性可以自己决定的。

2. 女性在研究活动中不活跃是有原因的

张铭北京大学信息科学技术学院教授

主题：基于知识图谱的机器学习

在一些场合与会议中，女性博士、教授看似不活跃，很多时候是会议的组织者未邀请，或由于会后社交活动不便参加等因素影响，而非女性学者、教授在学术科研领域会议中的交流、提问、报告不够积极。

3. 自然语言处理减轻性别偏差

黄萱菁复旦大学计算机学院教授

主题：自然语言处理中的表示学习

希望人工智能是性别平等的，它不会利用性别信息作为特征，不主动利用性别信息进行用户画像，不预先为担任某职责的人工智能设定性别，不被动地使用输入信息中隐藏的性别暗示。

4. 新冠疫情期间，女性发表论文的增量为什么比男性少？

朱小燕清华大学计算机系教授

在回答“新冠疫情期间，女性发表论文的增量为什么比男性少？”这个问题时，朱小燕认为这和科研工作本身的性质有关。科研需要长时间不间断、沉浸式思考，在疫情期间女性受到家庭的干扰比男性更多，不能做到像办公室里的百分之百投入。相比之下，男性的影响更小，甚至节约了很多社交时间。

在“女性如何在男性占优的领域往前走?”这个问题上，朱小燕强调：女性别老想性别问题，自己歧视自己；要咬着牙、不要抱怨、吃苦耐劳往前走

杨尔弘北京语言大学教授、智源学者

在回答“新冠疫情期间，女性发表论文的增量为什么比男性少？”这个问题时，杨尔弘认为疫情使得女性承担的家庭事务性工作骤增，包括家务、一日三餐、孩子在家需要照料，在内需要安排妥善家人的生活，在外受到各种信息的冲击，缺乏团队集聚、集中、安静的环境。

杨红霞，阿里巴巴达摩院资深算法专家

针对女性情绪化和自我贬低等问题，杨红霞认为打铁还须自身强、关键在于自己怎么看待自己。女性有很多得天独厚的优势，比如柔和的交流方式和细腻的心思，在强势的男性群体中做到润滑剂的作用，对生活的关怀也使得团体成员的体感更好。

——晚间全体大会：AI Time & 未来十年——

圆桌：AI Time：AI精度与隐私的博弈？

张钹，中国科学院院士、智源研究院学术顾问委员会主席

圆桌嘉宾

对于“提升模型精度是否一定意味着牺牲隐私保护？”这个问题，张钹认为：我认为AI与隐私保护的关系可以看作是技术与隐私保护的关系。首先我们必须认清隐私保护的定义是什么，千万不要夸大其词，另外，必须承认AI技术发展下隐私破坏问题逐渐突出。那么，我们做到AI盛行大背景下的数据隐私保护？我认为可以从以下几个点出发：首先，我们要避免个人隐私被误用与滥用，其次，我们如何用合理的技术手段保护个人隐私。

高文，中国工程院院士、智源研究院学术顾问委员会委员

圆桌嘉宾

对于“下一代人工智能技术应该具备哪些特点？”这个问题，高文认为：我认为排在首位也是可解释人工智能，也就是刚刚杨老师提到的，在这里我就不重复了。其次是高效的人工智能，即追求超越人类精度的同时，我们是否需要付出巨大的算力，成为下一代人工智能需要考虑的必要因素。

杨强，香港科技大学教授、微众银行CAIO

圆桌嘉宾

对于“以联邦学习为代表的AI新技术能否解决大数据协作与数据隐私保护之间的矛盾？”这个问题，杨强认为：联邦学习适应了人工智能、多方安全计算、数据加密和大规模分布式计算等多种不同技术的聚合。在过去，每一个边缘设备更新模型时，需要上传隐私数据到云端，然后再把新的模型分发到边缘端。那么我们是否能够传递加密后的模型参数，而不是传递用户的隐私数据，这个过程边便是联邦学习。这种应用场景还可以推广到企业与企业的应用场景中，使用加密传递的交互机制来保障得到大量的信息去完善机器学习模型，并保护各自独立的用户数据隐私。

对话：AI: the Past and Coming Decade

Bart Selman，AAAI候任主席、康奈尔大学教授

对话嘉宾

对于“中国人工智能研究的发展怎么加速？”这个问题，Bart Selman 认为：我对中国的人工智能研究领域的一个建议就是不要太狭隘，不要局限于现在已存在的问题或者已经被广泛研究的领域，比如深度学习，而是要去拓展新的领域，那可能才是突破口。

John Hopcroft，图灵奖得主、智源学术顾问委员会委员

对话嘉宾

对于“未来十年我们能否发展出通用人工智能？”这个问题，John Hopcroft 认为：

现在的人工智能研究还是一种基于提出的问题，来寻找解决方案的模式。在未来十年，人工智能技术的突破口并不在计算机科学界，而是取决于工程、生物、语言学等领域的突破。这些突破能让人工智能解决更多问题。所以，各个领域的教育和人才培养都是最重要的。

——AI对战《星际争霸》职业选手挑战赛——

启元星际指挥官挑战顶尖职业玩家大获全胜

2020年6月21日下午2点，由启元世界所开发的“星际指挥官”AI迎战人类顶级职业选手，并最终以4比0的成绩取得了胜利。

在《星际争霸II》中战胜顶尖职业选手，完成高水平的对弈，代表了AI在复杂电子游戏中取得的重大突破。当然，在启元世界看来，“星际指挥官”的作用远不止于打打游戏如此简单，最终的目标是将其中研发的技术应用到现实世界。从博弈决策到网络调度，从数字娱乐到机器人控制，都不乏应用场景。让我们期待启元世界带给我们下一次的惊喜！