【MDCC专访】刘少山：移动开发者需要对人工智能有好奇心和勇气

最新推荐文章于 2020-12-08 11:30:51 发布

周建丁

最新推荐文章于 2020-12-08 11:30:51 发布

阅读量570

点赞数

文章标签：人工智能无人驾驶 SLAM 机器人 MDCC

本文链接：https://blog.csdn.net/happytofly/article/details/80124812

版权

2016 年 9 月 23-24 日，由 CSDN 和创新工场联合主办的“MDCC 2016 移动开发者大会• 中国”（Mobile Developer Conference China）将在北京• 国家会议中心召开，来自iOS、Android、跨平台开发、产品设计、VR开发、移动直播、人工智能、物联网、硬件开发、信息无障碍10个领域的技术专家将分享他们在各自行业的真知灼见。

从8月8日起至9月4日，MDCC大会门票处于6.8折优惠票价阶段，五人以上团购更有特惠，限量供应（票务详情链接，6.8折优惠，欲购从速！）

当前人工智能的一个风口无疑是无人驾驶汽车，作为MDCC 2016人工智能与机器人专场的讲师，PerceptIn 联合创始人刘少山将会为与会开发者详细诠释无人驾驶技术。近日，刘少山接受CSDN的会前专访，分享了人工智能技术发展对移动开发带来的变化，以及机器人、无人驾驶汽车领域目前存在的一些问题，并展望了他对MDCC 2016的期待。

图片描述

PerceptIn联合创始人刘少山

刘少山，PerceptIn联合创始人。加州大学欧文分校计算机博士，研究方向包括智能感知计算、系统软件、体系结构与异构计算 (FPGA、GPU)。现在PerceptIn主要专注于增强现实、虚拟现实、机器人的核心SLAM技术以及其在智能硬件上的实现与优化。在创立PerceptIn之前在百度硅谷研发中心主要负责于百度无人车系统架构与产品化、大数据、深度学习以及异构计算平台的架构与开发。

以下为采访实录：

人工智能与移动开发

CSDN：谈谈您理解的人工智能，以及您关注的人工智能技术在工业界的一些应用方向。

刘少山：我是学系统出身的，那我就从系统的角度表达一下自己的想法。对我来说，在机器人场景中智能分为Perception，Insight，Intelligence三步。首先是机器人通过视觉语音等方式去了解这个世界，然后通过收集的大量数据来提取有用信息，最后从信息中提取并训练出智能。

在跟不少志同道合的朋友交流之后，我们都认为机器人首先会通过视觉与语音技术去感知这个世界，然后通过NLP技术去了解这个世界，并把学习到的知识建立为知识图谱，最后通过增强学习的方式去根据自身的知识与感知的信息去做决策。在无人驾驶的应用方面，其实视觉可以用于无人驾驶感知，语音与NLP可以用于人车交互，增强学习可以用于决策与控制。

CSDN：对于移动和嵌入式领域软硬件开发者来说，当前的人工智能热潮意味着什么？他们应该掌握哪些人工智能的技能来开发更好的应用？

刘少山：当前的人工智能热潮是一次大的技术革命，对广大技术人员来说是个特别好的机会，但是如果只掌握一个技术点是不足够的。根据我过去几年的经验，在技术行业隔行如隔山，比如做算法的对软件设计未必熟悉，专注做软件的很少懂系统，而懂系统的了解硬件的也不多。反过来也一样，让一个硬件工程师去写软件，他可能会觉得很难而不敢触碰。但是如果他能静下心来花点时间去学一下，其实这并没有想象中那么难。我在工作以及创业的过程中，发现能跨跃几个细分行业（比如软件、系统、硬件）的工程师非常难得也非常有价值。通常可以跨跃几个细分行业的人都比较有好奇心，也有勇气去尝试新的东西。我在百度美研时就有一个同事，有极强的好奇心与尝试的勇气，一年内把美研内部三个核心项目（异构计算、深度学习和知识图谱）都尝试了，而且都完成得很出色。在短短一年中，他已经融汇贯通，成为真正的全栈人才，也成为项目的核心人员了。

在人工智能热潮中，如果移动和嵌入式领域软硬件开发者可以多些好奇心与勇气，去尝试把一些开源的人工智能算法与系统移植到移动端，那么他既可以提高自身功力与价值，也可以通过移植的工作去了解一个新的方向，一举两得。比如MXNET是一个开源的深度学习平台，现在已经支持安卓，我们可以尝试在安卓上跑Inception-BN等不同的网络，也可以在平台上尝试深度学习加速与网络压缩等技术。其实移动端平台是很强大的，大家很多时候只用了部分的CPU，觉得计算能力很一般。我们公司使用了安卓手机的CPU、GPU、DSP等计算资源，把SLAM与深度学习系统成功整合到移动平台上，发现其实性能很不错，能耗也相当低。我甚至觉得如果把十几台手机拼起来，经过优化，是完全可以支撑无人驾驶的运算的——这有点极端，但我相信移动开发者可以容易地找到需要移动计算的场景，只是面临实现的挑战。

无人驾驶的挑战

CSDN：谈到无人驾驶，最近谷歌无人驾驶CTO离职，看来不是功成身退。您如何看待当前无人驾驶技术成熟度以及商业化的挑战？目前这个领域最需要的技术突破方向是哪些？

刘少山：无人车创业最重要是想清楚自己是想做乘着风飞的猪，期待在摔死前赚一笔，还是想长远发展，在拥有自己赖以生存的翅膀之后再去飞。现今，如果不计成本去做一台无人车，用最好的传感器、最好的算法以及最好的整合，那么这个无人车应该是可以做到安全可靠的，但是市场承受不了动辄几十万美金成本的无人车。所以要把无人驾驶技术变为产品，还需时日。

我认为无人驾驶技术会模块化，会出现分别专注于传感器、感知、决策以及高精地图的细分领域公司，然后还会出现专注于系统整合的公司为汽车商定制无人驾驶方案。现在大家都很关注传感器以及做感知技术的公司，但是忽略了在决策、高精地图，以及系统整合上其实有很大的机会。我们曾经与一个很大的汽车生产商聊过，发现他们根本就不在乎感知做得多好，因为不管感知能力多强大，感知技术公司现在没有方法去做行车时的实时决策，也没有高精地图，即使以上都有，他们也缺少有效的整合能力。

再这样发展下去，在无人驾驶市场车厂会比互联网公司有更大的优势。对车厂来说，这是个新的产品，他们可以逐步把成熟的技术加到车里，慢慢迭代。而对互联网公司来说，这是一个新的行业，技术并不是全部，还有各种他们不熟悉的因素，比如工业设计、汽车市场渠道、供应链和交通行业的规管等。

CSDN：您往返于硅谷和北京，看到国内外对无人驾驶的研发有哪些不同？国内有一些让您兴奋的创新？

刘少山：我每次回国都学习到很多。硅谷的团队一般有一定的技术优势，但是通病也是觉得自己的技术很牛，别人超越不了，有自视过高的问题。我在国内学习到两点很重要。

第一点是厚积薄发。
大家都知道，光学是无人驾驶传感器端一个核心的技术。在王阳明先生的故乡浙江余姚有一个企业叫舜宇，它在光学光电市场的占有率已经全球第一了，但是他们的口号是“坚定不移实施名配角战略”，注意是“配角”。一个市场占有率第一的企业以配角自居。我跟他们老总交流时说舜宇是个伟大的企业，他们老总却很谦虚地回应“我们远没到伟大”。从80年代起，他们一直专注光学，市场占有率是一点点地做上来的。在房地产最兴旺的时期，他们并没有转去利润更高的房地产业，而是继续专注光学实业，在当地招聘了1万多员工，支撑着1万多个家庭。他们很低调，专注做配角。大家都听过鼎鼎大名的Google Tango以及LeapMotion，但是谁知道Tango与LeapMotion的光学光电技术都是舜宇提供的呢？我特别佩服这种厚积薄发不浮躁的企业，在我看来他们是一个伟大的企业。
第二点是技术并不是唯一。
在深圳有个公司叫“易见联”，名字听上去特别“山寨”。我跟他们的郭总聊天，他说他跟打篮球的那位没关系，他们是做ADAS的，当时我觉得整个事情很逗。但是深聊之后，我发现郭总以前是做DVD的，在DVD没火起来的时候就进入了DVD市场了。接着，在智能手机爆发前夕他们就增加了智能手机业务。然后，在行车记录仪火起来了之前他们增添了行车记录仪业务。现在，顺着行车记录仪业务的发展，他们开发出ADAS产品线。听到这些，我特别佩服郭总，他们才是最前沿的人，站在了市场的最前线，有着敏锐的商业嗅觉与极强的生命力。他们的公司名与他们的公司一样，很接地气，很贴近市场。在市场这个事情上，他们是真正地厚积薄发。

所以，每次与舜宇、易见联这些企业的企业家聊天，我能学习与反思很多。

机器人核心技术创业

CSDN：您现在离开百度在机器人领域创业，能否介绍您的初衷？要实现什么目标？方便介绍目前进展？

刘少山：首先，我想先感谢一下百度美研的同事，在百度两年真的很开心，跟许多大牛学习到了很多，也结识了许多的挚友。我也想特别感谢一下我以前的上司James Peng，他给了我很多发挥的空间与机会。不夸张地说，百度美研是我工作过的最棒的地方。

关于创业这个事，我与好友张哲博士都很喜欢机器人，过去五六年一直都在关注机器人领域的发展，大家性格也很投缘，每周都聊，一直觉得要一起做点事情。聊的多了，在一个点上觉得差不多了，时机到了，就一起辞职创业了。

为什么觉得这个点到了呢？你看硅谷的发展，最早是从仙童半导体开始的，然后有了英特尔等芯片公司，把电脑越做越小，但是很难用。于是有了苹果与微软进行了一场技术革命，把电脑变得易用，从而个人电脑普及了。在个人电脑普及后，又一场技术革命是谷歌与百度等公司的出现把人与信息连接起来了。再有了人与信息的连接后，Facebook与微信等公司又把人与人连起来了，把人类社会搬到了互联网。在有了这样互联之后，Uber与Airbnb，包括更早的Amazon，又逐步把人类的商业模式互联网化了。到了今天，随着人类社会互联网化逐渐深入，以及人工智能的发展，我们认为机器人会逐渐代替人类去做一些服务类的工作，把人类从这些繁琐的工作中解放出来。所以我们决心出来创业。

说回技术，机器人研发很大的挑战来自于整合，与无人车相似，机器人并不是单一技术，是个计算的大集成，包括了传感器、计算平台、定位、地图、导航、避障和控制等等，如何把多个单点的技术很好地整合起来是一个很大的挑战。当前，我们公司首先专注的是机器人的核心SLAM定位技术以及这个技术在移动技术平台的整合与优化，我们的第一代产品很快会面世了。

在这里我要特别感谢一下张哲博士，我们创业初期遇到了很多很多的困难，有不少绝望时刻，但大家一直互相信任互相扶持，才走到今天，很不容易。前路肯定困难更多，但是我们坚信会成功走下去。

CSDN：基于什么理由选择从SLAM着手？

刘少山： SLAM是机器人的核心技术，是机器人的眼睛，我们首先要做好机器人的眼睛，让机器人可以动起来。然后会专注于利用人工智能技术去完善机器人的大脑，让机器人越来越智能。

多说一句，AR、VR与机器人的核心技术其实都是SLAM，有了SLAM后我们可以为VR游戏、AR应用以及机器人提供实时定位功能，因此可以说我们公司的目标并不局限于机器人。

CSDN：如您所说，创业的坑很多。创业之后，还会花多少时间在不太相干的无人驾驶技术方面？

刘少山：我会持续关注无人驾驶技术。我对这个技术的兴趣一直很浓厚，因为它并不是一个单一技术，而是一个众多技术的大整合，有挑战但前景无限。前面说过，这和机器人研发是相似的。关注无人驾驶，会让我们的视野更开阔，能够相互借鉴，使得我们的技术迭代更合理。

MDCC 2016前瞻

CSDN：谈谈您在MDCC分享的话题，将会让听众收获什么？

刘少山：这次主要想与大家系统地聊一下无人驾驶涉及的各项技术，包括无人驾驶传感器技术、无人驾驶操作系统、高精地图技术、决策与控制技术、无人驾驶安全、模拟与测试技术以及无人驾驶硬件平台。

对于无人驾驶技术链条上的开发者，希望可以帮助他们从全局的视角更深刻地理解开发需求和技术路径；非无人驾驶领域的移动开发者也可以得到借鉴，包括了解人工智能的技术版图和应用潜力，以及将人工智能技术引入现有系统/应用的可行步骤和注意事项。

同时，在这个专业的移动开发者技术盛会，我也希望听到更多关于人工智能、VR/AR开发等前沿技术的干货分享。

总之，期待届时能和大家多多交流。

2016 年 9 月 23-24 日，由 CSDN 和创新工场联合主办的“MDCC 2016 移动开发者大会• 中国”（Mobile Developer Conference China）将在北京• 国家会议中心召开，来自iOS、Android、跨平台开发、产品设计、VR开发、移动直播、人工智能、物联网、硬件开发、信息无障碍10个领域的技术专家将分享他们在各自行业的真知灼见。

从8月8日起至9月4日，MDCC大会门票处于6.8折优惠票价阶段，五人以上团购更有特惠，限量供应（票务详情链接，6.8折优惠，欲购从速！）