从 2006 年到 2016 年,我感触最深的是,这 10 年是深度学习的普及和推广期,其在很多应用中取得了突破性进展;但所有成果均为感知方面的应用,如图像识别、语音识别等。而从 2016 年开始,最大的不同是像AlphaGo和自动驾驶等人工智能系统,开始从感知过渡到决策;这些系统基于对这个世界的理解,从而主动优化它的决策机制。因此,从感知到决策是最大的变化,人工智能只有做决策才能真正改变世界。我认为在未来的 10 年里,怎么优化地去做
决策是人工智能的重点课题。
下面,我就 2016 以来人工智能产业发展中的一些话题,谈谈自己的想法。
2016 年 AI 圈让人记忆深刻的事
(1)AI 计算硬件。英伟达的股票在一年时间内从 100 亿美金增长到 500 亿美金,震惊业界。背后的原因是处理器架构因为人工智能的需求正在被重新定义,Google也推出 TPU 来做 Inference。除此之外,包括地平线机器人在内的不少公司正朝着这个方向去探索。
(2)算法层面。如生成式对抗网络等算法的突破性进展,使我们看到除了
CNN、RNN、LSTM,技术还在不断推陈出新,让这个行业变得越来越有意思。
(3)开源平台。在 2016 年,开源平台体系在不断成熟,如 TensorFlow、Caffe等,特别是由中国学生发起的 MXNet 成为亚马逊 AWS 官方训练平台这件事,很了不起。
(4)AlphaGo 事件。改写了全社会从街头百姓到政治对人工智能的认知,实现了大家均认为不能实现的事情。
(5)人才流动。Hinton 的得意门生、CMU 副教授 Ruslan,最近也耐不住寂寞加入苹果,担任苹果人工智能研究总监。斯坦福大学李飞飞教授也加入了谷歌。
OPEN AI LAB 与嵌入式人工智能
历史上技术创新和商业模式的创新都是相伴相生的,我们也看到,开放总是会打败封闭,怎么打造良性的产业生态是我们非常关心的。因此最近地平线和 ARM、安创空间、全志联合成立 OPEN AI LAB,我们希望把技术向半导体厂商、开发者开放,大家一起去定义嵌入式人工智能的标准。至于为何要做嵌入式人工智能?过去推动人工智能的核心要素可以概括为大数据、大计算、大平台,其在互联网和云端做人工智能的技术与服务。如果朝更远的方向看,我们会发现除了从云端部署人工智能,其实很多场景下急需在设备端部署人工智能,使这些设备具备环境感知、人机交互、决策控制的能力。以自动驾驶为例,如果有孩子横穿马路,当自动驾驶系统感知到之后,需要把信号传送到云端再做决策,假如当时网络不稳定的话,结果是不可想象的,因此我们需要本地计算去做实时决策。
创业公司做项目一定要选择大公司不大容易进入的维度,BAT 在数据、人才、资源、服务方面的势能,创业公司很难去挑战。但本地低功耗人工智能计算不是他们的强项,也不是他们的业务重点。另外我认为创业一定要选难度较大的事情去做,嵌入式人工智能需要把软硬件结合,并重新定义处理器架构,这是非常复杂的工程。这项任务虽然困难,但我认为只要达到这样的维度才能构建宽广的护城河。我们希望把嵌入式人工智能构建成一种开放生态,使其未来在端上产生很多创新,让意想不到的创新点在此发生:开放式生态可以把许多想法从一个创意变成产品,而这些想法和产品又会反哺地平线。
AI 团队的招聘心得
在美国和百度时,招聘是我每天需要面对的事,因此我自身有着相当多的经验。另一方面,在地平线,我们也在积极吸引优秀人才的加入。吸引人才加入是一件很有挑战的事情,因为现在人工智能人才还是比较稀少,我们做的事情又比较难,而且又是一条长线征途,所以有些人不理解我们的方向,我们做的事情在他们看来是既小众又没那么容易变现的事。
我遇到一些从事人工智能算法的同学,他们有几年深度学习经验就迫不及待地想改变世界,所以不太愿意去做一些偏长线的事情,但他们没有意识到真正有价值的事情都是困难的事情、有壁垒的事情。所以我经常告诉他们创业是一场艰苦的修行,而不是一场 Party,如果艰苦的修行走下来,无论是在路上还是在山顶上,那种满足感和成就感都是无法比拟的。
当公司做的方向跟主流方向不一样时,这种情况下吸引来的人才是为难得和特殊的,因为他们是经过自己冷静思考来做事情,这批人往往是推动公司上下做一番事业的人才。地平线确实非常有幸,在很短的时间内招到了顶尖人才,包括算法、软件系统专家和硬件专家。我在百度时领导的团队平均年龄是 26 岁,而地平线工程师平均年龄是 32 岁。因为我们是非常偏技术的公司,确实需要非常资深的人加入。
对于一个商业公司来讲,算法人才和产品经理同等重要。这里我要强调一点,何为研究大牛?我认为研究大牛的特质是“要有自己的思考和深厚的积累,他能够持续的创新”。其实能创造性地做出世界级成果的人是非常稀缺的。一个算法人才普遍学习过 1~3 年的深度学习,会用开源平台去训练模型,即使是这样的人也不多,而这些人更谈不上是研究大牛。所以我认为研究大牛是一种很稀缺的人才。当然,AI 产品经理也非常重要,因为他定义需求。如果造出来一个东西技术水平高,但不能解决实际问题,技术再高也没有实际价值。因此我们在创办一个商业公司,AI 产品经理也十分重要。
人工智能创业公司与未来发展
从目前来讲,绝大部分人工智能创业公司都是在基于 GPU 这样的计算平台和在基于 Caffe、TensorFlow 这样的开源平台,用比较成熟的模型结构来训练,然后做一些解决性问题和 Demo,差异化确实不明显。基于现在的开源模式来做创新,在算法方面壁垒确实也不高。所以这就导致在一些标准问题里,各创业公司的效果都差不多,技术差距也并不大。这里面的核心原因之
一就是中国人工智能原创性技术太少。
最近大家在说中国 AI 的人才、技术储备、研究、创新都有优势,这个观点我不太认同。实际上,国内学生在已经讨论出解决办法的情况下去做拿竞赛、刷分,这方面我们很擅长。但真正做出 AlpahGo 这样的创新,咱们还差些火候,而且国内也缺乏孵化这种创新的土壤。今年深度学习原创性的基础研究在大步向前发展,然而我几乎没看到哪些进步是国内产生的。
经过观察国内十几年的产业周期发现:以往多数项目均为 To C 产品,都是以产品创新和微创新为鲜明特征。中国没有经历通过技术创新为主的经济增长模式,而硅谷等地已经历过好几波技术创新,这在中国很少见。中国大部分投资机构和创业者,并不善于技术类投资以及做 To B 这种生意,所以大家还不太习惯对这类公司进行估值。我们一谈到投资和创业,永远面对新的产业方向,然而在面对新的产业方向即便是海外专业投资公司也不一定看得准,所以也能看到像投资 MagicLeap 这样的新型公司都是有争议的。
实际上,人工智能产业仍处于早期阶段,重大应用场景还在不断摸索,产出的确非常低。但如果回到“.com”时代,你会发现当时的商业模式也是探索了很长时间。资本市场确实有追逐短期回报的现象,所以明年下半年到后年,即便整个 AI 投资市场趋冷也并不奇怪。AI 行业与“.com”时代一样,即便是趋冷,但也不会影响到整体的趋势。因为 AI 确实在推动产业发展,实实在在创造价值,它不会进入一个万劫不复的寒冬。实事求是地说,如果按照投资机构的计算方法,AI 泡沫是一定存在的。AI 创业公司确实估值比较高,而且市场进展也并不尽如人意,但是到 2017 年或后年一定会有所变化。从长期趋势来看,适当泡沫纯属正常,就像啤酒有泡沫味道才更好,正是因为泡沫才让各公司都有机会去登上舞台。不论怎样,大家亮个嗓子,在舞台上唱一下。
最后,我想说,我对 2017 年充满了期待,希望未来人工智能处理器硬件行业会有大的突破;同时相关算法上继续持续创新;在某些应用场景上出现重大突破,如医疗、自动驾驶、智能家居等。
(根据余凯在 2016 年雷锋网第 100 期硬创公开课的分享整理)
地平线机器人创始人兼 CEO,前百度研究院执行院长,曾领导百度深度学习研究院 (IDL)、多媒体技术部(语音、图像)等团队,并连续三次荣获公司最高荣誉——“百度最高奖”。