北京智源大会 | AI 产业下个十年中的大变量

智源社区

于 2020-06-24 20:59:17 发布

阅读量371

点赞数

原文链接：https://hub.baai.ac.cn/

版权

整理：常政、王炜强、贾伟

2020年6月22日晚，在第二届北京智源大会晚间圆桌论坛上，智源研究院四位理事单位的相关负责人“云上相聚”，围绕“人工智能产业的下一个十年”这个主题发表了独到的见解，他们分别是：百度CTO王海峰、小米副总裁崔宝秋、旷视科技首席科学家孙剑、美团首席科学家夏华夏。智源研究院运营副院长刘江担任主持人。

在圆桌讨论中，嘉宾们盘点了过去10年里AI产业中的重要进展，梳理了可能影响未来10年发展的几个重要变量，如小数据、AIoT、客户侧训练等，并结合自己在工业界的实践体会，对高校老师、学生们的AI研究，提供了一些参考建议。

下面，是嘉宾们的精彩观点摘要。

上排从左至右：孙剑、刘江、崔宝秋

下排从左至右：王海峰、夏华夏

过去十年：人工智能从“实验”走向“实用”

问题：回顾过去十年，你对AI产业印象最深刻的事情是什么？

王海峰：如果总结一下过去10年，那便是人工智能真正从实验室走向实用、走向工业大生产的10年。百度做人工智能，首先是用AI来改造搜索引擎，并对它有一个全面的布局，包括语音技术、视觉技术、自然语言、知识图谱等。

就我个人经历而言，我在百度已经工作了10年。记得我在2010年刚加入百度时，接手了一个机器翻译的项目，一年后上线。当时机器翻译虽然主要基于统计和规则，还没有采用深度学习，但借助于互联网大数据和强大的计算平台，翻译系统仍旧实现了比较迅速的提升。2015年，我们上线了首个基于神经网络的机器翻译系统，这使得翻译系统取得了突破性的进展，迄今为止这个系统已经实现了全球200种语言的互译，每天的翻译体量已经达到千亿字符。我从事机器翻译工作已有20、30年，这种现象在早些年是完全不可想象的，它已经真正实现了大规模产业化。

孙剑：有两个Moments对我影响很大。第一个是于2012年，Hinton和他的学生Alex Krizhevsky 设计、推出了AlexNet。对于AlexNet 当时的训练结果，包括我在内的很多做计算机视觉的人，都不太敢相信，怀疑可能是数据集出了什么问题。到了2013年，Google 宣布将它的深度学习放到Google Photo（当时叫 Google Picasa）上，我便将自己的几百张单反照片传上去进行了检测，发现识别结果居然大多是正确的。这给了我非常大的震撼，之前我做过一些包括Sparse Coding等方法在内的非深度学习的图像识别，根本没有想到深度学习居然会有这么好的效果。这颠覆了我对图像识别的认识，也让我萌生了非常大的信心，我就立刻组织了一支团队来加大这方面的研究。

夏华夏：的确，这10年来人工智能的发展非常快。记得我2013年加入美团时，它还没有算法团队，直到2013年下半年才开始有了第一个与人工智能相关的项目——用户画像，此项目希望通过对用户的理解来完成更好的用户推荐和搜索。现在七年过去了，人工智能几乎已经渗透进了美团的每一个业务中（现在约200多个），除了做推荐搜索，我们还做智能配送调度、人脸认证和识别、文字识别、智能语音交互、智能语音客服，以及无人车、无人机等等。这种变化真的让人非常兴奋。

崔宝秋：我想补充一点的是，20多年前当我还在读博士的时候，其实是很羞于讲自己是研究人工智能的。时至如今，尤其是AlphaGo问世之后，最大的一个改变就是大家都可以非常骄傲地讲“我做的是AI”。

刘江：之前孙剑、海峰都谈到了，过去10年AI为什么兴起，最重要的就是深度学习。我们现在来看Gartner的一个总结——深度学习的时间线：

深度学习算法最早可以追溯到1958年、1986年，但这波浪潮真正能起来，是2010年是DeepMind创立，以及2011年之后，如孙剑所谈到的，在ImgNet 等比赛里突然有人用深度学习处理视觉、语音等产生了非常大的突破，包括之后一些深度学习框架、以及GAN的诞生等。当然了Gartner 这张图还有很多真正内行的信息没有包容进去。我曾经跟崔宝秋交流过，他说印象最深的是Google 实现让机器自己会识别猫了。这让我意识到，这次人工智能在公众视野中的全面兴起还不是因为ImgNet 这种专业小圈子的比赛，大家真正意识到AI的存在是因为AlphaGo的诞生：它居然能把围棋界最厉害的李世石都下赢了！这是令公众印象非常深刻的一个点。

影响未来十年的变量：
小数据、AIoT、客户侧训练…

问题：展望未来十年，你认为哪些因素可能成为大变量，改变AI产业格局？

刘江：过去十年，人工智能对整个信息产业产生特别大的影响。我专门查找了一下 2010 和2019这两年的Gartner报告，我们看到一个有意思事情：

2010年的Gartner新技术报告中，没有人工智能，也没有深度学习，而到了最新的2019年报告，深度学习已经不再出现，因为不算新技术了。这说明，即使像Gartner这样专业跟踪技术发展的公司，也没有第一时间关注到以深度学习为代表的这一波人工智能技术的兴起。

另一方面，我个人感觉过去十年真正创造产业价值的人工智能技术：

1）搜索。以百度、Google为代表的，两家公司都曾经是互联网界、甚至信息产业界市值最高的公司，非常大的商业机会。

2）推荐系统。字节跳动是推荐系统的公司，百度很多业务也是推荐系统在支持，阿里、淘宝起来推荐系统也起到非常重要的作用。昨天在智源大会上，启元世界的创始人（当年曾在淘宝负责系统）说淘宝从千万级用户量到亿级，推荐系统起到至关重要的作用。但是很多人并没有真正注意到这些。无论是百度、字节跳动还是阿里，它里面核心技术是推荐。

3）调度。刚才华夏讲到美团、滴滴，这类公司是O2O，向物理世界去服务的，这里面非常核心的是调度，智能调度系统。

但是这几个领域，相对来讲在学术界的关注度不是太高。

总结过去十年明显的重要突破显然是深度学习，但是要挖掘一个技术的价值，还要看应用领域，比如搜索、推荐、调度等领域，我们要更细更深一层看这个事情。

王海峰：我想从两个方面来说：技术和产业。

从技术层面看，现在的人工智能算法和应用都是基于大数据，计算量非常庞大，我相信未来10年中，在小样本、低能耗的学习机制领域一定会发生突破。另一方面，人工智能不仅需要数据，也离不开知识，我相信对知识的挖掘、掌握和充分利用，包括基于知识的的多模态语义理解等，也会成为一个重要的突破方向。还有一个方面，则是人工智能的可解释性问题，亟待大家去解决。

从产业层面看，我认为在人工智能“软硬一体化”方向，比如AIoT等，包括其在与应用场景深度融合的过程中，一定会产生很多突破。

夏华夏：我想根据电影和书籍举一些例子，来阐述我的判断。首先，在电影《机器人总动员》中，有一个镜头让我深受感触：它描绘的是人类无需工作，每天躺在一个特定的椅子上，由机器人代替完成所有的吃喝娱乐。这说明，在未来人工智能与硬件结合之后，会大幅度提升工业自动化水平，这是一个大趋势和大方向。

此外，在电影《黑客帝国》中，机器通过与人类的脑部进行连接，为人类营造出一个完全虚拟的影像与感受，我认为这会是未来娱乐的终极形态。这涉及到所谓的纯数字化，与近年来流行的神经学、脑科学研究，以及我们对人类认知的一些理解等密切相关，这方面如果能够有所突破，对娱乐、学习、教育等领域都会产生很大的影响。

第三方面，在《银河帝国》这本书中，银河系每个星球、每个人、每个生物与非生物都互相连接到了一起，一切都有了意识与思考，这与当前万物互联的趋势非常相似。我认为，随着5G的普及和推广，以及物联网技术的发展，未来将有大量数据与物体连接到这个大网里。那么AI技术如何去处理如此巨量的数据、如此多的非生物意识，将是一个很有意思的挑战。

孙剑：我想向大家分享一下我看好的小方向、小变化。

第一，是目前比较热门的自监督学习，从去年年底开始，它已经出现了可喜的进展：以前，我们需要通过ImgNet上有标注的数据，进行有监督的训练来获得一些特征（Feature），而今天已经可以不用标注数据就能学到一样好或者稍微更好的特征。这将会对我们的应用产生非常积极的影响。设想一下，这意味着当你在一个特定场景里，可以通过大量无标注数据预训练出它的特征，然后只需要通过小量的样本，在那个场景里就可以实现更好的成绩。所以我非常看好这个研究方向，包括我们旷视研究院也在非常积极地做这方面的工作。

第二，我也非常看好芯片和算法的协同演化和协同设计，这方面在智源大会“智能体系架构和芯片”专题论坛上有多个报告介绍，我就不展开了。

第三，鉴于机器学习训练所需要的数据，往往都分散在各行各业、各个企业中，很难拿到，所以我比较看好数据安全训练，或者说隐私安全训练的进展。这个方向上的突破，很可能是以第三方的角度提供一个高安全、高可信的机器学习环境，从而在客户那里，能真正地把各行各业的数据价值挖掘出来。我们团队内部将这种模式称为“客户侧训练”。

崔宝秋：我特别想说对于王海峰老师的两个观点，我深以为然。我觉得以下是未来可能产生大变量的方向：

第一是小数据AI。未来能否基于小样本、小数据，基于逻辑和推理，融合过去的AI技术，学到一些新的学习能力，做到通用的人工智能？我希望在这方面能存在一个大变量。

第二是广义的开源。它不仅是代码的开源，更是数据的开源、知识的共享等。

第三是AI与其他技术的融合，包括：AI 与AR、VR的融合，从而实现非常自然的真正人机交互；AI与5G、6G等通讯技术的融合，5G将衍生很多新应用场景，6G将实现泛人工智能；AI 和IoT（物联网）各种设备的融合，真正打造一个以人为中心的整体智能服务。综合我认为，这是一种从IoT到AIoT的质变，从GUI（图形用户界面）到VUI（语音、视觉用户界面）的质变，从个体到整体的质变。所以小米打造AIoT是一个很好的方向，它构建的生态几乎能容纳所有的AI企业，包括技术、产品和生态等。

AI 研究：立足基础理论，连接产业真实场景

问题：作为产业的代表，对于AI学术界的老师同学，你有什么期待和建议？

孙剑：对于学生而言，首先一定要打好基础。在深度学习方向，要打好编程基础，比如用好Python、能熟练地使用至少一个深度学习框架等。其次，深度学习是一个富于实践性的学科，涉及很多优化，所以我建议大家能够去熟悉优化的基本理论、场景算法等。这里，我要推荐以前上学时候读过的一本书——《数值算法大全》，书中包含了每个算法的高质量code，相信对深度学习研究者们的帮助会比较大。另外，我觉得还是要全方面的建立、培养科研素质，不迷信权威、勇于挑战前沿智慧等。对于刚毕业的同学而言，如果想快速进步，一个最好的方法是找一个好的研发环境，周围有经验丰富的同伴，比如选择象我们在座诸位的企业等。

夏华夏：首先对老师来说，我建议要多跟产业界合作，产业界有很多真实场景和大量真实数据，现在是时候把在学校里对人工智能理论方面的积累应用到真实场景中来了。其次，我要告诉同学们，现在肯定不用担心人工智能已经到了末尾，如果考虑一下像《黑客帝国》所描绘的人机接口或《银河帝国》的终极世界，我们离它们还很遥远。现在肯定不是结束，甚至都不是结束的开始，最多算开始的结束。

崔宝秋：我阐述两个观点。第一，我认为AI的春天刚刚开始，尤其从AIoT的角度看，有很多应用场景都还没有将AI的能力充分发挥出来，产品的创新、智能场景的创新会带来很多技术的创新。AI这个春天能持续多久，在于我们所有从业人员的呵护。其次，很多基础技术的研究是需要坚持的，如果我们都很在意一个领域火不火，犹豫要不要进去，这便反映了一种急功近利、挑肥拣瘦的心态，是需要研究人员摒弃的。

王海峰：我认为AI未来在理论研究、技术开发、产业发展上具有非常广阔的前景，只要认准方向、坚定去做，就一定会有收获。

刘江：我最后做个总结。刚才几位产业嘉宾的总结都是有一些共识的。

首先是这波AI的大发展中，现在还是处在一个比较早的时期，未来还将有一个很长的发展阶段。所以从我们工程技术人员的角度来讲，之前深度学习等为代表的很多技术红利，在包括应用层在内的很多层面，还刚刚开始起步，还需要进一步的拓展。同时，对于在校的老师同学来讲，尤其这次疫情之下，我们已经能看到数字化、无人化等趋势，正在快速地发展，所以这个大前景下还是有非常多的事情、场景等待我们科研人员去探索和研究

但是在外在的热潮中，大家也要注意看清、把握事情的整个本质，不能人云亦云、急功近利，而是要关注基础，真正把理论、技术和产业的原理、发展脉络搞清楚，这是一个需要大家能沉静下来，进行长期耕耘的过程。

智源社区

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
北京智源大会 | AI 产业下个十年中的大变量

整理：常政、王炜强、贾伟2020年6月22日晚，在第二届北京智源大会晚间圆桌论坛上，智源研究院四位理事单位的相关负责人“云上相聚”，围绕“人工智能产业的下一个十年”这个主题发表了独到的见...
复制链接

扫一扫