导语:2016年,整个人工智能产业呈现出爆炸式的发展,它给人类生活带来各种各样的可能,更给了人类想象力足够发挥的空间。未来,人工智能的发展趋势究竟是什么?人工智能热潮下,研究和产业能够碰撞出怎样的火花?
6月6日下午,大数据文摘记者有幸在清华大学人工智能论坛专访清华大学计算机系教授、中国科学院院士张钹。针对人工智能领域的产业和创业,年过八旬张院士给出了自己的见解和意见。
人物简介:张钹,清华大学计算机系教授,中国科学院院士。曾任信息学院学术委员会主任,智能技术与系统国家重点实验室主任,中国自动化学会智能控制专业委员会主任,《计算机学报》副主编等。主要从事人工智能理论、人工神经网络、遗传算法、分形和小波理论等研究;以及把上述理论应用于模式识别、知识工程、智能机器人与智能控制等领域的应用技术研究。
大数据文摘对话张钹院士(大数据文摘记者袁璐 摄)
6月6日下午,大数据文摘在清华大学伟伦楼见到了已经年过八十的张钹院士。茶歇间隙,老先生被一拨又一拨的人围住,从高校到企业,大家的问题都围绕“人工智能”展开。从1978年就开始研究人工智能的张钹,在历经几十年的沉淀之后,从整个行业发展包括人工智能产业的过去、现在和未来,给了大家足够详尽的阐释。
张院士迄今已培养73位博士生,“1/3是在研究院和高校任职,2/3在大公司的研究机构任职,少数创业。参加创业的不到10%,6个人,这6个人中目前有2位基本成功了,有4位正在路上,至今还没有一个完全失败了的,他们创业的领域都跟信息技术相关。”张院士在圆桌会议上如此骄傲的说。
大数据文摘有幸聆听了张钹院士在清华人工智能论坛上的精彩演讲,并在会后对张钹院士进行了“创业”专题的专项提问,希望以下回答能够给已经在人工智能领域或马上要踏入人工智能领域的你一些启发。
以下为专访部分音频剪辑,希望能够还原张钹院士给大家的建议。
大数据文摘:您对人工智能和大数据这两个方向的创业者有什么建议?
张钹院士:这两个领域肯定是目前最重要的创业方向,当然也要具体分析。我的博士生毕业之后打算创业的,我通常都和他们交谈,我一般问的问题是,你有什么想法,你的想法别人有没有。如果你的想法别人没有,那就要看这个想法靠谱不靠谱,因为只有在靠谱的情况下你才能走下去。如果说,你的想法别人也有,我就要问他,你凭什么会成功,会比别人搞得更好。往往最热的领域,全世界最聪明的人都会投进去,你凭什么战胜那些人,靠什么?当然靠你独特的技术路径和方法。在中国,如果要搞与互联网有关的产业,你就需要考虑这件事BAT有没有兴趣,一旦他们参与进来,你如何与他们竞争。要记住你想做的事肯定要有一个门槛,如果这个门槛过低,那么当大企业投入更多的人和钱来做这件事时,你就很难坚持了。
归根结底,你要有自己的创新,你采用的技术路线和商业模式要有独到的地方。你要熟悉你想创业的领域,这样你才能知道什么可以做,有什么困难等等。
大数据文摘:如果让您在人工智能领域创业,您会选择哪个方向?
张钹院士:选择创业领域首先要知道你的优势在哪里,别人的弱点在何处。比如,我想搞医疗健康大数据。目前从事医疗健大数据康服务与管理的人很多,首先需要考虑已有的工作有什么缺陷,我们有没有机会。我们会发现尽管现在有很多人从事医疗健康大数据,但大多没有认识到这项工作质量的重要性,这是他们的弱点。为什么很多人做不好,就是因为他们一开始就想赚钱,急功近利,对质量不重视,这样肯定做不好。因为这项任务涉及到人身安全与健康,绝对不能在质量上出问题。那么,如果我们要在这个领域创业,就要把民生放在第一位,为人服务放在第一位。办企业当然最终目的是要赚钱,但不能把它放在第一位。如果我们沿着这条路线走,就有可以战胜急功近利的人。
还有一个就是教育,比如,机器人教育,即把机器人作为教育的载体。有了互联网之后,多数人的学习与娱乐都是在二维空间中进行,这对人的认知和成长很有缺陷。所以,需要在学习过程中融入实体,与真实世界交互。,搞教育是我们的专长和优势,凭借这个优势我们有可能做得比别人好。一定要记得: 许多事情你想到了,别人也肯定能想到。因此当你在某个领域创业时,一定会有许多人在做同样的事情。
◆ ◆ ◆
1907年《绿野仙踪》正式出版,莱曼·弗兰克·鲍姆在书中这样写道:“非常有责任感,能想出各种点子,并能完美会话的机器人。它能思考、说话、行动,以及做一切事情,除了活着。“1907年的鲍姆大概没有想到,几百年之后他笔下的“铁皮人”会真实出现在人们的生活,并带来一个称为“人工智能”的时代。
◆ ◆ ◆
几十年沉浮 人工智能时代到来?
1956年,在美国达特茅斯学院举行的一次会议上“人工智能”的研究领域正式确立。会议的参加者在接下来的数十年间成为AI研究的领军人物。他们中有许多人预言,经过一代人的努力,与人类具有同等智能水平的机器将会出现。同时,上千万美元投入到AI研究中,以期实现这一目标。
而在同一年清华大学设立了自动控制专业,第一届学生仅有10个人,是分别从原有的电机系各个专业抽调过来的,当时21岁的电机与电器制造专业三年级学生张钹也在其中。
六十年后的今天,人工智能的发展正进入前所未有的大好时期,不少人开始高呼:“人工智能创业风口似乎已经到来。”
人工智能的“热潮”并非首次出现。在上世纪七八十年代,人工智能曾经产生过第一次创业高潮,当时把人工智能技术应用到产业界的创业公司也有成百上千家,但是,当时的热潮只是昙花一现。
张钹院士将三十年前人工智能技术到产业应用的失败主要归结为,早期传统人工智能模型—专家级系统的不完善。随着专家系统应用的不断深入,专家系统自身存在的知识获取难、就事论事、推理能力弱等问题逐步暴露出来。进一步分析发现,这些困难涉及人工智能研究的根本问题。如何缩短学术与技术,技术与应用之间的距离,即可扩展(Scaling up)问题。20世纪80年代中期多个国家很多计划开始面临重重困难,已经看出达不到预想的目标。
三十年前发生的事情今天又重新提出来,我们今天如何看待它?它究竟会不会像三十年前那样昙花一现?我们又该如何避免三十年前的失败结局?
◆ ◆ ◆
AI机遇下如何引领创新创业?
随着计算机能力的增长,人工神经网络、深度学习在足够大的数据量和计算能力的支撑下,人脸识别、字迹识别、语音识别技术不断发展。
“面对如此大的市场规模,大家寄予非常大的希望。面对这些机遇,我们该如何利用这样的机会,如何真正地利用好人工智能技术避免出现昙花一现的结果成为了我们现在急需要解决的问题。”在清华人工智能论坛上,张院士作了主题为《人工智能技术引领创新与创业》的演讲。
“人工智能技术的研究做得好不好,体现在是否能建造高性能的智能机器上”,张钹院士在演讲中如此提到。这样的智能机器基本包含三部分。第一部分:感知,感知周围的环境,适应周围的环境,这是人工智能需要的条件之一。第二部分:认知,就是理性思考。前面是感性,动物也具有部分感知能力;后面是理性,基本上只有人类才有。第三部分:执行,就是动作控制与协调。如控制肢体和脸部的运动等。人工智能研究首先从认知开始。认知行为就是逻辑思维或者理性思考,这是最高一级的智能行为,第二个就是感知(视觉、听觉、触觉等),第三个是动作协调控制(智能控制),最后我把情感、灵感、理解或者意识等放在单独的一类。
所谓人工智能产业应该具备以下几个特征,。第一个要素是感知,就是利用传感器和感知的信息,使得系统能够感知周围的环境、适应周围的环境。第二个要素是使用知识,第三个要素是使用大数据。只要产业中涉及其中之一,大体就可认为属于人工智能产业了。“用人工智能技术来引领创新,从而带动创业,便是所谓的‘技术引导创新与创业’。“张院士说。
◆ ◆ ◆
面对各种挑战 如何在创业洪流里从容面对?
“人工智能现在走到什么地方,会遇到什么样的挑战,怎么解决。”提到人工智能的创业挑战,张院士给了详细的阐释和具体的解决办法指导:
第一个挑战是人工智能可解决问题的限制
第一个问题是,“我们知道我们的知道”(we know what we know),即知其然又知其所以然的问题。在人类理性思考与分析中有许多属于这类问题,原则上可以通过启发式搜索模型,或者基于知识和经验为基础的推理模型由机器来实现。,在一定范围和限制条件下,机器可以做到和人类一样好。
第二个问题是:感知问题,它属于“我们不知道我们的知道(we do not know what we know )”,就是知其然不知其所以然的问题,这类问题可以用机器学习的方法,或者神经网络学习的办法由机器来实现。而且在限定的场合下机器也可以做得跟人类一样好,甚至超过人类。
第三类问题是,“我们知道我们的不知道(We know what we do not know)”,比如理解、直觉、情感、意识等,我们既不知其然,又不知其所以然,这能做吗?可以做,即通过大数据学习,通过“黑箱”学习的方法去模拟。但是这样机器模拟出来的性能水平一般来讲要比人类的性能差得比较多。
第四个问题是“我们不知道我们的不知道”(we do not know what we do not know),由于我们还不知道这个问题的存在,自然无法解决。等问题被发现之后,才有可能考虑解决的办法。
第二个挑战是人工智能已有方法的局限性
第一个方法称为“知识驱动法”。这个方法的好处在于跟人类解决问题的方法相近,易于理解。,由于既有的知识表示过于就事论事,难以推广,需要考虑抽象一点的知识表述方法。比如,用概率统计手段,把文本中的“词”抽象成向量等等。第二个方法是“数据驱动方法”,就是大数据学习,深度学习。现在所有的机器学习方面都是基于概率统计,概率统计的好处是便于处理大数据,简单地讲,概率方法的基本原理是:数据越多结果的质量越高,所谓的“大数定理”,它是概率方法的基石。但是概率的方法是一种黑箱法,分不清因果,只要重复出现多了,就认为是规律、是真理。所以用这种方法来处理质量比较差的生数据,就产生一个致命的问题,就是错误的东西重复多了就变成正确的了,无用的东西重复多了就被认为有用。不幸的是,网络中的数据尽管很多,但大部分是生数据。这个问题应该引起大家的注意。另外是数据稀疏问题,笼统地讲,大数据数据量很大,但是跟你研究的问题直接有关的数据不见得很多,这个就是所谓的数据稀疏,比如每天超市里的交易量很大,但是具体考虑到张三的交易量就很稀疏、很少了。表面上数据很多,直接对你有用的数据却很少。
人工智能无疑成为今天科技发展的重中之重,让冷冰冰的设备更加“懂”人,人与设备之间的互动变得更加自然而直观,也是众多创业者趋之若鹜的原因。面对这些挑战,加强技术支撑,对问题进行理性分析、分类解决,则变得尤为重要。“只有综合利用既有的技术,改进既有的技术,才能引导创业。”张院士谈到。
在清华人工论坛离席之前,张钹院士给所有“创业者”寄语如下:
“有一句话,我自己深有体会,深思出智慧。你要想做某件事情必须经过深思熟虑,把问题想清楚、想透彻。如果大家有决心搞这件事情就必须花时间用心去思考。特别是想创业的人,你想创业你有什么招没有,你要搞的东西大家都能想到、都会去搞,你的优势在哪儿?万一将来BAT也来搞,你凭什么搞得过它?这些问题都考虑清楚了,你就可以勇往直前地去干。”
清华人工智能RONG论坛背景:
6月6日下午,由清华海峡研究院、北京清华工业开发研究院、数据科学研究院共同主办的清华人工智能论坛盛大举办。本次活动邀请了清华人工智能领域的权威专家和校友产业界代表相聚清华,学术泰斗与产业嘉宾思想碰撞,共同为人工智能发展问诊把脉。来自学术界、产业界、投资机构、政府部门以及媒体单位共500余人到现场参加了此次论坛,另有3000余观众通过在线视频直播收看了论坛实况。清华RONG系列论坛由清华大学数据科学研究院发起。每次针对一个领域的相关研究方向,联合清华大学相关院系和清华大数据产业联合会的成员共同参与。目前已成功举办“大数据与新闻传播”、“大数据与医疗健康”等十期。
清华人工智能论坛独家赞助商捷通华声公司:
捷通华声公司自2000年创建以来,专注全方位人工智能技术产业发展,2011年,推出国内最大最全的人工智能开放平台——灵云。2013年,清华大学产业发展基金投资捷通华声,共同确立实现“灵云科技 源自清华 服务全球”的战略发展目标。2014年、2015年,通过双方战略合作,相继共同创建了“清华灵云人工智能研究中心”、“清华海峡研究院人工智能研究中心”,致力于清华大学人工智能技术产业化应用,确立并巩固清华大学在中国人工智能产业发展中的领导地位。
*大数据文摘【思享者】栏目*
本期对话记者袁璐:中国传媒大学硕士,主修通信,新闻双学位。把技术和文字结合,白天敲代码晚上码汉字。目前对数据新闻感兴趣,新闻的可视化多元化是研究的兴趣点。最喜欢一句:心有猛虎,细嗅蔷薇。
思之,分享之,所谓【思享】也。而我们想做的,就是把真正的思想分享出去,我们叫自己【思享者】。大数据文摘【思享者】栏目专注对话大数据行业最有思想的人物,记录并传递最in的数据干货,分享对时下数据形式问题的态度。
原文发布时间为:2016-06-16
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号