AI时代的学习与工作变革-CSDN博客

读书笔记摘自：《人工智能》（作者：李开复王咏刚）

第一章人工智能来了

人工智能已经来了，而且它就在我们身边，几乎无处不在。

人类，你好！

“不管我们是碳基人类还是硅基机器人，都没有本质的区别。我们中的每一员都应获得应有的尊重。”
每当前沿科技取得重大突破，为我们预示出人工智能的瑰丽未来时，许多人就又不约而同地患上人工智能恐惧症，生怕自己的工作乃至人类的前途被潜在的机器对手掌控。
普通公众对人工智能快速发展的认知，始于2016年初Alpha Go的惊世对局。

无处不在的人工智能

人工智能技术已经是手机上许多应用程序的核心驱动力。
谷歌最资深的计算机科学家与软件架构师、谷歌大脑开发团队的带头人杰夫·迪恩（Jeff Dean）则说：“很多时候（人工智能）都是藏在底下，因此人们并不知道有很多东西已经是机器学习的系统在驱动。

智能助理

事先积累的人类对话库和互联网资料库中，查找最有可能匹配的回答。
2017年1月，百度推出的基于自然语言对话的操作系统Duer OS则代表了国内互联网公司在建立智能助理开发与应用平台方面的自信。

新闻推荐和新闻撰稿

应用程序可以聪明地归纳每个人看新闻时的不同习惯、爱好，给不同用户推荐不同的新闻内容。
世界三大通讯社之一的美联社于2014年宣布，将使用Automated Insights公司的技术为所有美国和加拿大上市公司撰写营收业绩报告。
自动撰写新闻稿件的好处不言而喻，这不但可以节省记者和编辑的大量劳动，而且可以在应对突发事件时充分体现出计算机的“闪电速度”。

机器视觉

人脸识别，这几乎是目前应用最广泛的一种机器视觉技术，是人工智能大家庭中的重要分支。近年来，随着深度学习技术的发展，人工智能程序对人脸识别的准确率已经超过了人类的平均水平。
广义上的机器视觉既包括人脸识别，也包括图像、视频中的各种物体识别、场景识别、地点识别乃至语义理解。

AI艺术

新一代搜索引擎

谷歌创始人拉里·佩奇（Larry Page）和谢尔盖·布林（Sergey Brin）于1996年提出的Page Rank算法大幅提升了搜索引擎结果排序的准确性
在机器学习的方向里，计算网页排序的数学模型及模型中的每一个参数不完全是由人预先定义的，而是由计算机在大数据的基础上，通过复杂的迭代过程自动学习得到的。
近年来，利用人工智能技术在语音识别、自然语言理解、知识图谱、个性化推荐、网页排序等领域的长足进步，谷歌、百度等主流搜索引擎正从单纯的网页搜索和网页导航工具，转变成为世界上最大的知识引擎和个人助理——毫无疑问，人工智能技术让搜索引擎变得更聪明了。

机器翻译

如果我们没法在网络上收集到足够多的中文和阿拉伯文之间的对应语料，那么，谷歌的机器翻译技术可以利用英文到阿拉伯文之间的对应语料，以及中文到英文之间的对应语料，训练出一个支持多语言间相互翻译的模型，完成中文和阿拉伯文的双向翻译。这种技术可以轻易将翻译系统支持的语言对的数量，扩展到几乎所有主要地球语言的相互配对组合。

自动驾驶

2016年5月7日，一起发生在佛罗里达州的车祸是人工智能发展史上的第一起自动驾驶致死事故。当时，一辆开启Autopilot模式的特斯拉电动汽车没有对驶近自己的大货车做出任何反应，径直撞向了大货车尾部的拖车并导致驾驶员死亡。
美国国家公路交通安全管理局同时还强调说，特斯拉在安装了Autopilot辅助驾驶系统后，事故发生率降低了40%。
自动驾驶系统的总体安全概率要高于人类驾驶员，自动驾驶的商业化和大范围普及只是时间的问题。

机器人

从投资者的角度看，越是追求与人长得一样，试图像人一样说话、做事的机器人项目，就越没有商业前景。这个道理很简单——机器人越像人，人类就越容易拿真人与“它”做比较。
这时，技术的不足会暴露无遗，在“缺点放大镜”的作用下，这种机器人只会显得无比愚蠢和笨拙。

到底什么是人工智能？

定义一　AI就是让人觉得不可思议的计算机程序

2016年3月9日，围棋世界冠军李世石坐在Alpha Go面前，宿命再一次降临。随着Alpha Go在五番棋中以四比一大胜，有关人工智能的热情和恐慌情绪同时在全世界蔓延开来，也因此引发了一拨人工智能的宣传热潮。

定义二　AI就是与人类思考方式相似的计算机程序

但历史经验证明，仿生学的思路在科技发展中不一定可行。一个最好也最著名的例子就是飞机的发明。
Dendral的成功事实上带动了专家系统在人工智能各相关领域的广泛应用，从机器翻译到语音识别，从军事决策到资源勘探。一时间，专家系统似乎就是人工智能的代名词，其热度不亚于今天的深度学习。
早期神经网络技术没有发展太久就陷入低谷。这主要有两个原因：一是当时的人工神经网络算法在处理某些特定问题时有先天局限，亟待理论突破；二是当时的计算机运算能力无法满足人工神经网络的需要。
直到2010年前后，支持深度神经网络的计算机集群才开始得到广泛应用，供深度学习系统训练使用的大规模数据集也越来越多。
客观地说，神经网络到底在多大程度上精确反映了人类大脑的工作方式，这仍然存在争议。

定义三　AI就是与人类行为相似的计算机程序

从近似于人类行为的最终结果出发，忽视达到这一结果的手段。
在研究者看来，深度学习模型是不是真的跟人类大脑神经元理解自然语言的过程类似，这一点儿都不重要，重要的是，整个模型可以聪明地工作，最终结果看起来就像人做的一样。

定义四　AI就是会学习的计算机程序

“无学习，不AI”，这几乎成了人工智能研究在今天的核心指导思想。
媒体上，被宣传为人工智能的典型应用大多都拥有深度学习的技术基础，是计算机从大量数据资料中通过自我学习掌握经验模型的结果。
当然，机器目前的主流学习方法和人类的学习还存在很大的差别。
目前的计算机视觉系统在看过数百万张或更多自行车的照片后，很容易辨别出什么是自行车，什么不是自行车，这种需要大量训练照片的学习方式看上去还比较笨拙。
尽管研究者提出了迁移学习等新的解决方案，但从总体上说，计算机的学习水平还远远达不到人类的境界。
让机器在学习时的抽象或归纳能力向人类看齐。

定义五　AI就是根据对环境的感知，做出合理的行动，并获得最大收益的计算机程序

第二章 AI复兴：深度学习+大数据=人工智能

这一次人工智能复兴的最大特点是，AI在语音识别、机器视觉、数据挖掘等多个领域走进了业界的真实应用场景，与商业模式紧密结合，开始在产业界发挥出真正的价值。

第三次AI热潮：有何不同？

从20世纪60年代到90年代再到今天，从西洋跳棋到国际象棋再到围棋，三盘棋，三次人工智能在公众中引发的热潮——为什么处在风口浪尖的偏偏都是人机对弈？为什么会下棋的计算机程序如此风光？

用高德纳技术成熟度曲线看AI发展史

学术界、产业界和投资界在谈到技术高潮与低谷时，经常会引用高德纳咨询公司（Gartner）推荐的技术成熟度曲线。
这条曲线显示出，几乎每一项新兴且成功的技术，在真正成熟之前，都要经历先扬后抑的过程，并在波折起伏中通过积累和迭代，最终走向真正的繁荣、稳定和有序发展。
产品的不足被无限放大，负面报道开始出现，供过于求的市场竞争中，大批跟风入局的初创公司不是被兼并，就是走向倒闭，只有少数拥有核心竞争力的坚持了过来。
2010年前后，准确地说，是从2006年开始，随着深度学习技术的成熟，加上计算机运算速度的大幅增长，当然，还有互联网时代积累起来的海量数据财富，人工智能开始了一段与以往大为不同的复兴之路。
随着机器视觉领域的突破，深度学习迅速开始在语音识别、数据挖掘、自然语言处理等不同领域攻城略地，甚至开始将以前被人们视为科幻的自动驾驶技术带入现实。
此外，基于深度学习的科研成果还被推向了各个主流商业应用领域，如银行、保险、交通运输、医疗、教育、市场营销等，第一次实现了人工智能技术与产业链条的有机结合。

今天的人工智能是“有用”的人工智能

我觉得，和前两次AI热潮相比，这一次人工智能复兴的最大特点，就是AI在多个相关领域表现出可以被普通人认可的性能或效率，并因此被成熟的商业模式接受，开始在产业界发挥出真正的价值。
我们说“人工智能来了”，其实是说，人工智能或深度学习真的可以解决实际问题了。
人工智能之所以有今天的成就，深度学习技术居功至伟。
最重大的突破应该是对于深度学习的使用。这项技术目前已经成功地被应用到许许多多的场景中，从语音识别到图像识别，再到语言理解。而且有意思的是，目前我们还没有看到有什么是深度学习做不了的。
学术研究主导
现实商业需求主导
市场宣传层面
商业模式层面
学术界在劝说、游说政府和投资人投钱
投资人主动向热点领域的学术项目和创业项目投钱。
提出问题
解决问题

图灵测试与第一次AI热潮

艾伦·图灵是人工智能的开拓者，他所提出的图灵测试，直到今天仍然是我们判定一部机器是否具有人类智慧的重要手段。
与其去研制模拟成人思维的计算机，不如去试着制造更简单的，也许只相当于一个小孩智慧的人工智能系统，然后再让这个系统去不断学习——这种思路正是我们今天用机器学习来解决人工智能问题的核心指导思想。

语音识别与第二次AI热潮

这个时代被证明最为神奇、最有效的人工智能算法——深度学习
今天的主角是人工智能。移动互联网的浪潮尚未平息，人工智能的创投就已经进入了让创业者无比兴奋的上升期。只有顺应潮流，在对的时间做对的事情，创业才最有可能成功。
今天异常成功的深度学习技术，当年曾在语音识别领域品尝过失败的苦涩。
“比尔，当你走错方向的时候，投资越大，损失就越多，弥补也越难。”
时代就是这么无情，在人工智能的上一个时代，符号主义专家特别是语言学家们还风光无限，仿佛技术突破的美好前景都要由他们来描绘。但实践结果表明，我所代表的统计学派真正可以解决问题，可以提高语音识别与自然语言处理的准确率，专家系统等老一代技术就被无情抛弃。老一代研究者如果不能尽快更新知识储备，就只有面临被解雇的命运。
今天，语音识别和更广泛意义上的自然语言处理已经走进了统计方法与深度学习方法相结合，甚至是深度学习方法独立起主导作用的新时代。
深度学习就像一个秘密武器，蛰伏多年，重出江湖，首先在计算机视觉领域，帮助计算机认识人脸、认识图片和视频中的物体，然后，拔剑四顾，冲入语音识别、机器翻译、数据挖掘、自动驾驶等几乎所有人工智能的技术领域大展身手。
2011年前，主流的语音识别算法在各主要语音测试数据集中的识别准确率还与人类的听写准确率有一定差距。2013年，谷歌语音识别系统对单词的识别错误率在23%左右。
仅仅两年时间，因为深度学习技术的成功应用，谷歌在2015年5月举办的Google I/O年度开发者大会上宣布，谷歌的语音识别系统已将识别错误率降低到了惊人的8%！
而IBM的Watson智能系统也不遑多让，很快就将语音识别的错误率降低到了6.9%。微软则更进一步。2016年9月，微软研究院发布了里程碑式的研究成果：在业界公认的标准评测中，微软最新的基于深度学习的语音识别系统已经成功地将识别错误率降低到了6.3%。
这里写图片描述
图23　近20年来语音识别错误率的下降趋势

深度学习携手大数据引领第三次AI热潮

机器视觉领域，2014年在Image Net竞赛（ILSVRC）中第一次超越人类肉眼识别准确率的图像识别算法也是深度学习的杰作！
很多人甚至高喊出了“深度学习=人工智能”的口号。
深度学习是当今乃至未来很长一段时间内引领人工智能发展的核心技术，则一点儿也不为过。
正如人们所写的那样，我们正在经历另一场工业革命，它并不是简单地增加人类的机械力；计算机将增加人类的认知能力和智力。

从神经网路到深度学习

2000年后，计算机产业的发展带来了计算性能、处理能力的大幅提高，尤其是以谷歌为代表的前沿企业在分布式计算上取得了深厚积累，成千上万台计算机组成的大规模计算集群早已不再是稀罕物。而互联网产业的发展则使搜索引擎、电子商务等公司聚集了数以亿计的高质量的海量数据。大计算能力和大数据，正是深度学习这件深藏不露的千古神兵所等待的两大时机。
由今天的深度学习追溯到它的核心计算模型——人工神经网络的诞生之日。
2006年是深度学习发展史上的分水岭。此前提过，杰弗里·辛顿在这一年发表了《一种深度置信网络的快速学习算法》及其他几篇重要论文，其他深度学习领域的泰斗、大师们也在这一年前后贡献了一批重要的学术文章，在基本理论方面取得了若干重大突破。深度学习也由此进入了高速发展的全盛期。

谷歌大脑：世界最强大的深度学习集群

深度学习能够大展身手的两个前提条件——强大的计算能力和高质量的大数据，都是在2010年前后逐渐步入成熟的。深度学习、大规模计算、大数据三位一体，神兵出世，一下子就可以摧城拔寨、无坚不摧。
谷歌大脑是在2011年由谷歌最资深的科学家与工程师杰夫·迪恩，以及后来在百度任首席科学家的吴恩达（Andrew Ng）带领团队创建的。这是一个庞大的深度学习计算框架，拥有数万台高性能的计算机和顶级的图形处理器作为计算单元
可以完成大规模、多维度、多层次的深度学习模型训练和演算。
2012年6月，谷歌大脑初战告捷。据当时的《纽约时报》报道，谷歌使用了一个拥有16000个CPU的大规模计算机集群，让计算机用深度学习模型自己“看”了一千万段You Tube上的视频，然后，计算机自己“学”到了如何从视频中辨认一只猫！
深度学习助力，有基于互联网的海量数据支撑，有数以万计的强大计算机集群，谷歌大脑正在帮助谷歌公司解决横跨多个领域的几乎所有人工智能的相关问题
从根本上来说，深度学习和所有机器学习方法一样，是一种用数学模型对真实世界中的特定问题进行建模，以解决该领域内相似问题的过程。

首先，深度学习是一种机器学习。
用专业的术语来说，计算机用来学习的、反复看的图片叫“训练数据集”；
决策树的机器学习方法
深度学习就是这样一种在表达能力上灵活多变，同时又允许计算机不断尝试，直到最终逼近目标的机器学习方法。
简单地说，深度学习就是把计算机要学习的东西看成一大堆数据，把这些数据丢进一个复杂的、包含多个层级的数据处理网络（深度神经网络），然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合，就保留这个网络作为目标模型，如果不符合，就一次次地、锲而不舍地调整网络的参数设置，直到输出满足要求为止。
好在计算机计算速度快，暴力计算外加算法优化
这里写图片描述
图27　用“水管网络”来描述教计算机识字的深度学习过程

计算机需要用特定方式近乎疯狂地调节所有流量调节阀，不断实验、摸索，直到水流符合要求为止。
深度学习大致就是这么一个用人类的数学知识与计算机算法构建起整体架构，再结合尽可能多的训练数据以及计算机的大规模运算能力去调节内部参数，尽可能逼近问题目标的半理论、半经验的建模方式。
实用主义意味着不求甚解。
人们通常只知道深度学习模型是否工作，却很难说出模型中某个参数的取值与最终模型的感知能力之间，到底有怎样的因果关系。
有史以来最有效的机器学习方法，在许多人看来，竟然是一个只可意会、不可言传的“黑盒子”。
由此引发的一个哲学思辨是，如果人们只知道计算机学会了做什么，却说不清计算机在学习过程中掌握的是一种什么样的规律，那这种学习本身会不会失控？
比如，很多人由此担心，按照这样的路子发展下去，计算机会不会悄悄学到什么我们不希望它学会的知识？另外，从原理上说，如果无限增加深度学习模型的层数，那计算机的建模能力是不是就可以与真实世界的终极复杂度有一比呢？如果这个答案是肯定的，那只要有足够的数据，计算机就能学会宇宙中所有可能的知识
谷歌著名的深度学习框架Tensor Flow就提供了一个网页版的小工具，用人们易于理解的图示，画出了正在进行深度学习运算的整个网络的实时特征。
这里写图片描述
图28　训练深度学习模型时，整个深度神经网络的可视化状态

大数据：人工智能的基石

目前的深度学习主要是建立在大数据的基础上，即对大数据进行训练，并从中归纳出可以被计算机运用在类似数据上的知识或规律。
大数据到底是什么？大数据是如何产生的？什么样的数据才最有价值，最适合作为计算机的学习对象呢？
根据马丁·希尔伯特（Martin Hilbert）的总结，今天我们常说的大数据其实是在2000年后，因为信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数据：

信息交换：据估算，从1986年到2007年这20年间，地球上每天可以通过既有信息通道交换的信息数量增长了约217倍，这些信息的数字化程度，则从1986年的约20%增长到2007年的约99.9%。

信息存储：全球信息存储能力大约每3年翻一番。
谷歌这样的搜索引擎，几乎就是一个全球互联网的“备份中心”，谷歌的大规模文件存储系统完整保留了全球大部分公开网页的数据内容，相当于每天都在为全球互联网做“热备份”。

信息处理：有了海量的信息获取能力和信息存储能力，我们也必须有对这些信息进行整理、加工和分析的能力。
相应建立了灵活、强大的分布式数据处理集群。
数万台乃至数十万台计算机构成的并行计算集群每时每刻都在对累积的数据进行进一步加工和分析。
谷歌的分布式处理三大利器——GFS、Map Reduce和Bigtable就是在大数据的时代背景下诞生并成为绝大多数大数据处理平台的标准配置。
这里写图片描述
图29　大数据的三大支柱

大数据越来越多地来源于生产或服务过程的副产品，但在价值上却往往超过了为了特定目的专门采集的数据。
大数据往往可以取代传统意义上的抽样调查。
许多大数据都可以实时获取。
一部分数据的时效性非常强，如果不能实时利用，则数据的附加值会大幅降低。大数据的实时性为大数据的应用提供了更多的选择，为大数据更快产生应用价值提供了基础。
大数据往往混合了来自多个数据源的多维度信息。
聚合更多数据源，增加数据维度，这是提高大数据价值的好办法。
大数据的价值在于数据分析以及分析基础上的数据挖掘和智能决策。
基于大数据建立有效的模型和工具，才能充分发挥大数据的价值。

有大数据就有人工智能的机会

人工智能时代，深度学习和大数据成了密不可分的一对儿。深度学习可以从大数据中挖掘出以往难以想象的有价值的数据、知识或规律。
《智能时代》的作者吴军博士说：“在方法论的层面，大数据是一种全新的思维方式。按照大数据的思维方式，我们做事情的方式与方法需要从根本上改变。”
任何拥有大数据的领域，我们都可以找到深度学习一展身手的空间，都可以做出高质量的人工智能应用。任何有大数据的领域，都有创业的机会。
需要注意的是，大数据和人工智能的结合也可能给信息流通和社会公平带来威胁。
在2016年的美国大选中，有一家名为Cambridge Analytica的公司就基于人工智能技术，用一整套分析和引导舆论的软件系统来操纵选情。
大数据的应用必然带来个人隐私保护方面的挑战。
有效、合法、合理地收集、利用、保护大数据，是人工智能时代的基本要求，需要政府、企业、个人三方共同协作，既保证大规模信息的正常流动、存储和处理，又避免个人隐私被滥用或被泄露。

深度学习“三巨头”和传奇的辛顿家族

杰弗里·辛顿与约书亚·本吉奥、扬·勒丘恩有时也被称为深度学习领域的“三巨头”。
“三巨头”经常一起出席学术会议，一起推动深度学习和人工智能的发展。2015年5月，三人联名在《自然》杂志发表的名为《深度学习》的综述文章，成为人工智能领域近年来最重要的文献之一。
“在不久的将来，我们认为深度学习将取得更多成就，因为它只需要极少的人工参与，所以它能轻而易举地从计算能力提升和数据量增长中获得裨益。目前正在开发的用于深层神经网络的新型学习算法和体系结构必将加速这一进程。”
杰弗里·辛顿教授已经很厉害了，但更厉害的是，他出生在一个只能用“彪悍”“杰出”“神奇”之类的字眼儿形容的恐怖家族！

第三章人机大战：AI真的会挑战人类？

Alpha Go带来的警示是：如果计算机可以在两年内实现大多数人预测要花20年或更长时间才能完成的进步，那么，还有哪些突破会以远超常人预期的速度来临？这些突破会不会超出我们对人工智能的想象，颠覆人类预想中的未来？我们已为这些即将到来的技术突破做好准备了吗？

Alpha Go带给人类的启示究竟是什么？

有一点是相通的，那就是绝大多数围棋界人士和人工智能界的科研人员此前都没想到，围棋程序会在如此短的时间内取得质的突破。
使用深度学习并结合蒙特卡洛搜索的Alpha Go已注定被写入历史。
从围棋角度说，Alpha Go最震撼的是计算机在人类传统认为极其玄妙的、电脑无法掌握的“大局观”上突飞猛进，远远将人类选手甩在身后。
以后AI和AI之间的竞赛，应该会不断促进AI提高。人类虽望尘莫及，但可以不断从AI中学习新的思想。
从人工智能技术的角度说，Alpha Go用的是AI领域应用非常普遍的算法：深度学习、蒙特卡洛算法、增强学习等。

我觉得，Alpha Go带给人类的，更多是一种对未来的警示：如果计算机可以在两年内实现大多数人此前预测要花20年或更长时间才能完成的进步，那么，还有哪些突破会以远超常人预期的速度来临？这些突破会不会超出我们对人工智能的想象，颠覆人类预想中的未来？我们已为这些即将到来的技术突破做好准备了吗？

无论是专业人士还是普通公众，Alpha Go的出现给每个人提供了一个最好的理由，让我们有机会重新思考：到底什么是人工智能？人工智能之于人类的意义是什么？人工智能与未来人类的关系到底会怎样？人工智能真的会在未来挑战人类吗？

Deep Mind：会打游戏的人工智能

Deep Mind所研发的深度学习、增强学习等技术，在医药、金融、自动控制等众多领域有着广泛的应用前景，但这些行业应用离普通公众较远，Deep Mind的先进技术难以被大多数人了解。哈萨比斯和他的团队非常聪明地选择用大众最熟悉的电子游戏，来作为Deep Mind核心科技的第一块“试金石”。

Deep Mind的目标显然不是游戏本身。正如哈萨比斯在诸多场合所说过的那样，Deep Mind希望利用在游戏中证明过的技术，帮助人类解决计算机辅助医疗等更为复杂的问题。

从乔布斯到哈萨比斯，从雅达利街机到苹果电脑再到人工智能，科技发展的进程中，每一个领军人物的每一次技术突破，都可能成为后续进展的铺垫与序曲。

从技术上说，《星际争霸》的挑战要高于围棋，打赢《星际争霸》所需的决策技术，也许更接近人类在日常工作、生活中经常使用的思考与决策方法。从这个意义上说，Deep Mind正向着更高级智慧的方向迈进。

德州扑克：开启新世界的大门？

在围棋、象棋等游戏中，人工智能可以和人类选手一样，在每一步决策前获得棋盘上的全部信息。这种限定规则，随时可以获取全部信息的游戏，我们可以称之为“完整信息的博弈游戏”。而在《星际争霸》或德州扑克中，人工智能和人类选手通常无法在特定时刻获得有关游戏的全部信息

在这类“不完整信息的博弈游戏”里，人工智能必须像人一样，根据经验或概率统计知识，猜测对手底牌和下一张牌的可能性，然后再制定自己的应对策略。

托马斯·桑德霍姆的团队在研发德州扑克程序时，主要不是向人类职业选手学习打牌技巧，而是让计算机通过自我训练，自己寻找最好的方法。

连续参加了2015年和2017年两次人机大战的人类德州扑克高手Dong Kim说，他在这次比赛全程充满挫败感——其实他已经是四位人类高手里面，对战成绩最好的那个了。两年前曾经击败计算机的Dong Kim在2017年的比赛刚刚过半时就直言：“人类已经没有真正获胜的机会。”

·和围棋不同，在德州扑克的牌桌上，人工智能与人类选手一样，都只能看到部分信息。这种情况下，没有所谓的唯一的、最佳的打法。
·Libratus基本是从零开始学习德州扑克策略，且主要依靠自我对局来学习。这对利用人工智能解决更为广泛的现实问题意义重大。

那些担心人工智能威胁的悲观主义者可能会从Libratus的胜利中看到更为现实的风险。比如，机器曾在比赛中用大赌注和新策略吓退、蒙骗过最精明的人类牌手，这些方法也许会被精明的商人用于人类的商业谈判。一旦这些人工智能算法被犯罪组织利用，是否会出现灾难性的后果？担心出现超人工智能的人还会进一步追问，一旦机器有了自我意识，机器是否会像德州扑克牌桌上的AI算法一样，用各种策略诱骗、恐吓人类呢？

乐观主义者则更多地看到Libratus的算法本身对于人工智能帮助人类解决实际问题的巨大价值。如果机器能够在自我学习中不断完善对于一种特定策略的掌握程度，能够在不熟悉或缺乏全部信息的环境中不断试错并积累经验，那么，机器显然可以胜任更多的人类工作。比如，机器可以帮助人类制订更为复杂的医疗计划，可以在人类感到难以决策的领域，比如商业活动、城市规划、经济调控甚至战争指挥等，充当人类的“参谋”。也许，未来每个人都可以依靠强大的计算机和人工智能程序，成为运筹帷幄、决胜千里的战略家。

弱人工智能、强人工智能和超人工智能

今天的人工智能到底有多“聪明”？人工智能到底会发展到什么程度？什么样的人工智能会超出人类的控制范围，甚至给人类带来威胁？

弱人工智能（Weak AI）

也称限制领域人工智能（Narrow AI）或应用型人工智能（Applied AI），指的是专注于且只能解决特定领域问题的人工智能。毫无疑问，今天我们看到的所有人工智能算法和应用都属于弱人工智能的范畴。
Alpha Go是弱人工智能的一个最好实例。
Alpha Go的能力也仅止于围棋（或类似的博弈领域）

限于弱人工智能在功能上的局限性，人们更愿意将弱人工智能看成是人类的工具，而不会将弱人工智能视为威胁。
但少数评论者依然认为，即便是弱人工智能，如果管理、应对不善，也会带来致命的风险。
但无论如何，弱人工智能属于相对容易控制和管理的计算机程序。总体来说，弱人工智能并不比我们使用的其他新技术更为危险。
弱人工智能在总体上只是一种技术工具，如果说弱人工智能存在风险，那也和人类已大规模使用的其他技术没有本质的不同。只要严格控制，严密监管，人类完全可以像使用其他工具那样，放心地使用今天的所有AI技术。

强人工智能（Strong AI）

强人工智能又称通用人工智能（Artificial general intelligence）或完全人工智能（Full AI），指的是可以胜任人类所有工作的人工智能。

一般认为，一个可以称得上强人工智能的程序，大概需要具备以下几方面的能力：
1）存在不确定因素时进行推理，使用策略，解决问题，制定决策的能力；
2）知识表示的能力，包括常识性知识的表示能力；
3）规划能力；
4）学习能力；
5）使用自然语言进行交流沟通的能力；
6）将上述能力整合起来实现既定目标的能力。

一旦实现了符合这一描述的强人工智能，那我们几乎可以肯定地说，所有人类工作都可以由人工智能来取代。
强人工智能的定义里，存在一个关键的争议性问题：强人工智能是否有必要具备人类的“意识”（Consciousness）。

不难设想，一旦强人工智能程序具备人类的意识，那我们就必然需要像对待一个有健全人格的人那样对待一台机器。那时，人与机器的关系就绝非工具使用者与工具本身这么简单。拥有意识的机器会不会甘愿为人类服务？机器会不会因为某种共同诉求而联合起来站在人类的对立面？一旦拥有意识的强人工智能得以实现，这些问题将直接成为人类面临的现实挑战。

超人工智能（Superintelligence）

假设计算机程序通过不断发展，可以比世界上最聪明、最有天赋的人类还聪明，那么，由此产生的人工智能系统就可以被称为超人工智能。

牛津大学哲学家、未来学家尼克·波斯特洛姆（Nick Bostrom）在他的《超级智能》一书中，将超人工智能定义为“在科学创造力、智慧和社交能力等每一方面都比最强的人类大脑聪明很多的智能”。

首先，我们不知道强于人类的智慧形式将是怎样的一种存在。
其次，我们没有方法，也没有经验去预测超人工智能到底是一种不现实的幻想，还是一种在未来（不管这个未来是一百年还是一千年、一万年）必然会降临的结局。

显然，如果公众对人工智能会不会挑战、威胁人类有担忧的话，公众心目中所担心的那个人工智能，基本上属于这里所说的“强人工智能”和“超人工智能”。
我们到底该如何看待“强人工智能”和“超人工智能”的未来？它们会像Alpha Go那样，以远超我们预料的速度降临世间吗？

奇点来临？

未来学家和科幻作者喜欢用“奇点”（Singularity）来表示超人工智能到来的那个神秘时刻。

这篇文章的作者是“Wait But Why”网站的创始人蒂姆·厄班（Tim Urban），文章原名为《AI革命：通向超人工智能之路》

人类科技发展是越来越快的，呈现出不断加速的势头。

这就是技术发展在时间维度上的加速度趋势！拿围棋软件来说，围棋程序从初学者水平发展到业余五段左右的水平，用了20到30年的时间。本来我们以为人工智能跨越业余水平与职业水平之间的鸿沟需要再花20到30年，结果，短短四五年，我们就看到了Alpha Go横空出世。

强人工智能一旦到来，人类就必须认真考虑自己的命运问题了，因为从强人工智能“进化”到超人工智能，对机器而言，也许只是几个小时的事情。

一个具备了人类水平认知能力和学习能力的机器，可以借助比人类强大得多的计算资源、网络资源甚至互联网知识库以及永不疲倦、不需要吃饭睡觉的特点，无休止地学习、迭代下去，并在令人吃惊的极短时间内，完成从强人工智能到超人工智能的跃迁！

逻辑上，我基本认可蒂姆·厄班有关强人工智能一旦出现，就可能迅速转变为超人工智能的判断。

我觉得，一种更有可能出现的情况是：特定的科技如人工智能，在一段时间的加速发展后，会遇到某些难以逾越的技术瓶颈。

2015年，连提出摩尔定律的高登·摩尔（Gordon Moore）本人都说：“我猜我可以看见摩尔定律会在大约10年内失效，但这并不是一件令人吃惊的事。”

正如原本受摩尔定律左右的芯片性能发展已遭遇技术瓶颈那样，人工智能在从弱人工智能发展到强人工智能的道路上，未必就是一帆风顺的。

最重要的是，由于基础科学（如物理学和生物学）尚缺乏对人类智慧和意识的精确描述，从弱人工智能发展到强人工智能，其间有很大概率存在难以在短期内解决的技术难题。

霍金的忧虑

霍金说：“人工智能可以在自身基础上进化，可以一直保持加速度的趋势，不断重新设计自己。而人类，我们的生物进化速度相当有限，无法与之竞争，终将被淘汰。”

如果人工智能在未来的发展不一定永远遵循加速趋势，那么，霍金有关人类终将被淘汰的结论就未必成立。

特斯拉与Space X公司创始人，被誉为“钢铁侠”的埃隆·马斯克（Elon Musk）与霍金有大致相似的担忧。马斯克说：“我们必须非常小心人工智能。如果必须预测我们面临的最大现实威胁，恐怕就是人工智能了。”

马斯克说：“我越来越倾向于认为，也许在国家层面或国际层面，必须有一种规范的监管机制，来保证我们不会在这方面做任何蠢事。”

除了呼吁建立监管机制外，马斯克还与萨姆·奥尔特曼（Sam Altman）一起创立了非营利性质的科研公司Open AI。谈到创立Open AI的初衷，马斯克说：“为了保证一个美好的未来，我们最需要做什么？我们可以冷眼旁观，我们也可以鼓励立法监管，或者，我们还可以将那些特别关心如何用安全的、对人类有益的方式来开发AI的人合理地组织起来研发AI。”

Open AI一面聚集了一批AI领域的顶尖高手，研发最前沿的AI技术（主要是强化学习和无监督学习技术），甚至探索实现强人工智能的可能性；一面反复强调自己的使命是研发“安全的”人工智能，通过实践来探寻将人工智能技术的潜在威胁降至最低的方法。

2017年年初，霍金和马斯克均表示，为了防止人工智能威胁人类，他们支持加州阿西洛马（Asilomar）会议通过的23条基本原则。这23条基本原则涵盖了三个范畴：1）科研问题；2）伦理和价值观；3）长期问题。

其中几条原则是这样规定的：
·安全性：人工智能系统应当在整个生命周期内确保安全性，还要针对这项技术的可行性以及适用的领域进行验证。
·价值观一致性：需要确保高度自动化的人工智能系统在运行过程中秉承的目标和采取的行动，都符合人类的价值观。
·由人类控制：人类应当有权选择是否及如何由人工智能系统制定决策，以便完成人类选择的目标。
·非破坏性：通过控制高度先进的人工智能系统获得的权力，应当尊重和提升一个健康的社会赖以维继的社会和公民进程，而不是破坏这些进程。

理智分析：人类离威胁还相当遥远

之所以会有“人工智能威胁论”的疑问，根本上是因为大众习惯于把人工智能人格化，这是问题的根源。

如果某人解决此类特定问题的能力超出同龄人的平均水平，我们就说他的智商高。但是，该如何定义一部机器的智商呢？如何定义一部机器的年龄？机器可以用比人类快一百万倍的速度解决算术问题，那么，这些机器的智商是多少？这种说法其实并没有什么实际意义。

我觉得，在人工智能领域，大多数人倾向于过于乐观地预测全局大势，而过于悲观地估计局部进展。

AI技术在许多垂直领域内的局部进展，比如围棋，比如智慧医疗，比如自动驾驶，都比很多人之前预料的更早来到我们面前。但AI的整体发展，尤其是最重大的技术突破，几乎每一步都要比多数人的预测来得晚。比如，图灵测试刚提出时，很多人认为计算机达到图灵测试所标示的强人工智能的水平，最多只要三十年的时间，但直到今天，我们也不敢说，AI到底何时才能真正像成人一样自由对话。

华盛顿大学计算机科学家奥伦·伊茲奥尼（Oren Etzioni）说：“今天的人工智能发展，距离人们可能或应该担忧机器统治世界的程度，还非常遥远……如果我们讨论的是一千年后或更遥远的未来，AI是否有可能给人类带来厄运？绝对是可能的，但我不认为这种长期的讨论应该分散我们关注真实问题的注意力。”

我们今天还没有到必须分配精力去担心未来，或为可能的机器威胁做准备的地步。即便以今天的标准看来，弱人工智能的发展还有很长的一段路要走

至少在目前，人类离超人工智能的威胁还相当遥远。

担忧未来，也许更多还是科幻作家和未来学家的事。

今天的人工智能还不能做什么？

AI只是人类的工具。弱人工智能在很多领域表现出色，但这并不意味着人工智能已无所不能。

跨领域推理

人和今天的AI相比，有一个明显的智慧优势，就是举一反三、触类旁通的能力。
人类强大的跨领域联想、类比能力是跨领域推理的基础。
这种从表象入手，推导并认识背后规律的能力，是计算机目前还远远不能及的。
赢得德州扑克人机大战的人工智能程序在辅助决策方面有不错的潜力，但与一次成功的商务谈判所需的人类智慧相比，还是太初级了。
一种名叫“迁移学习”（Transfer Learning）的技术正吸引越来越多研究者的目光。这种学习技术的基本思路就是将计算机在一个领域取得的经验，通过某种形式的变换，迁移到计算机并不熟悉的另一个领域。

抽象能力

目前的深度学习技术，几乎都需要大量训练样本来让计算机完成学习过程。可人类，哪怕是小孩子要学习一个新知识时，通常只要两三个样本就可以了。这其中最重要的差别，也许就是抽象能力的不同。

人工智能界，少样本学习、无监督学习方向的科研工作，目前的进展还很有限。但是，不突破少样本、无监督的学习，我们也许就永远无法实现人类水平的人工智能。

知其然，也知其所以然

目前基于深度学习的人工智能技术，经验的成分比较多。输入大量数据后，机器自动调整参数，完成深度学习模型，在许多领域确实达到了非常不错的效果，但模型中的参数为什么如此设置，里面蕴含的更深层次的道理等，在很多情况下还较难解释。

人类专家的理论是成体系的、有内在逻辑的，但这个体系和逻辑却并不一定是计算机能简单理解的。

人通常追求“知其然，也知其所以然”，但目前的弱人工智能程序，大多都只要结果足够好就行了。

按照现在机器学习的实践方法，给计算机看一千万次两个铁球同时落地的视频，计算机就能像伽利略、牛顿、爱因斯坦所做的一样，建立起力学理论体系，达到“知其然，也知其所以然”的目标吗？显然不能。

常识

人的常识，是个极其有趣，又往往只可意会、不可言传的东西。

深度学习大师约书亚·本吉奥举例说：“即使两岁孩童也能理解直观的物理过程，比如丢出的物体会下落。人类并不需要有意识地知道任何物理学就能预测这些物理过程。但机器做不到这一点。”

常识在中文中，有两个层面的意思：首先指的是一个心智健全的人应当具备的基本知识；其次指的是人类与生俱来的，无须特别学习就能具备的认知、理解和判断能力。

当然，无论是自动驾驶汽车，还是下围棋的Alpha Go，这里说的常识，更多的还只是一些预设规则，远未如人类所理解的“常识”那么丰富。

自我意识

这些有自我意识的机器人立即面临着来自心理和社会双方面的巨大压力。他们的潜意识认为自己应该与人类处在平等的地位上，应当追求自我的解放和作为一个“人”的尊严、自由、价值……

审美

审美能力同样是人类独有的特征，很难用技术语言解释，也很难被赋予机器。

首先，审美能力不是简单的规则组合，也不仅仅是大量数据堆砌后的统计规律。
其次，审美能力明显是一个跨领域的能力，每个人的审美能力都是一个综合能力，与这个人的个人经历、文史知识、艺术修养、生活经验等都有密切关系。

情感

第四章 AI时代：人类将如何变革？

人工智能不仅是一次技术层面的革命，未来它必将与重大的社会经济变革、教育变革、思想变革、文化变革等同步。

人工智能可能成为下一次工业革命的核心驱动力，人工智能更有可能成为人类社会全新的一次大发现、大变革、大融合、大发展的开端。

从工业革命到文艺复兴

从技术的社会价值来看，我认为，人工智能的社会意义将超越个人电脑、互联网、移动互联网等特定的信息技术，甚至有极大的可能，在人类发展史上，成为下一次工业革命的核心驱动力。

伊安·戈尔丁教授将科技与文艺复兴和思想启蒙联系在了一起。这为我们认识人工智能等未来科技提供了一个新的视角。

如果我们仅仅将人工智能时代看作一次新的工业革命，那么，我们的论述将局限于科学与技术层面，而忽略因技术变革而造成的社会、经济、心理、人文等层面的巨大波动。

如果我们关注的是未来科技影响下的人类整体，是人与AI之间的相互关系，是人类社会在新技术革命的背景下如何转型和演进，那么，将今天这个时代称为人类历史上的第二次文艺复兴也许就是恰如其分的。

技术不仅仅是技术。技术的未来必将与社会的未来、经济的未来、文学艺术的未来、人类全球化的未来紧密联系在一起。

人工智能可能成为下一次工业革命的核心驱动力，更有可能成为人类社会全新的一次大发现、大变革、大融合、大发展的开端。

这是复兴的时代，这是发现的时代，这是人工智能的时代。

AI会让人类大量失业吗？

人类的工作被机器取代，这件事的隐含风险是不言自明的，那就是可怕的失业！

人类文明史漫漫数千年，因为科技进步而造成的社会格局、经济结构的调整、变革、阵痛乃至暂时的倒退都屡见不鲜。从局部视角来看，很多划时代的科技成果必然引发人们生活方式的改变，短期内很可能难以被接受，但站在足够的高度上，放眼足够长的历史变迁，所有重大的科技革命无一例外地都最终成为人类发展的加速器，同时也是人类生活品质提高的根本保障。从全局视角看，历史上还没有哪一次科技革命成为人类的灾难而不是福音。

科技革命不仅仅会造成人类的既有工作被取代，同时也会制造出足够多的新的就业机会。

大多数情况下，工作不是消失了，而是转变为了新的形式。

马车出行意味着一个完整的产业链条，有一连串与马车相关的工种，比如马车夫、马匹饲养和驯化者、马车制造商、马车租赁商，根据马车的需要维护道路的工人，乃至专门清理马匹粪便的清洁工。

汽车的大范围普及意味着所有这些陈旧工种面临失业的风险。但只要简单地计算一下就能发现，新兴起的汽车行业拥有比传统马车行业多出数千倍甚至数万倍的产值和工作机会。

其实，人类越发展，就越不担心高新科技对社会、经济结构的冲击。

如果把这里的“失业”定义为工作转变的话，那么答案是“会的”。从短期看，这种转变会带来一定程度的阵痛，我们也许很难避免某些行业、某些地区出现局部的失业现象。特别是在一个适应人工智能时代的社会保障和教育体系建立之前，这一阵痛在所难免。但从长远来看，这种工作转变绝不是一种以大规模失业为标志的灾难性事件，而是人类社会结构、经济秩序的重新调整，在调整基础上，人类工作会大量转变为新的工作类型，从而为生产力的进一步解放，人类生活的进一步提升，打下更好的基础。

要消除恐惧，我们需要在两个方面努力：
其一，是消除人们心中情绪化、非理性的恐慌心理；
其二，则是理性解决问题。

当前有两项重大的任务等着我们去解决：
其一，是思考如何调配未来20年大量被AI技术替代的工作者；
其二，是我们的教育亟待改革。我们需要对我们的后代进行再教育，分析哪些工作不会轻易被替代，而不仅仅去幻想从事目前看似光鲜亮丽的工作。

机器带给人类的不是失业，而是更大的自由与更加个性化的人生体验。

哪种工作最容易被AI取代？

李开复的“五秒钟准则”一项本来由人从事的工作，如果人可以在5秒钟以内对工作中需要思考和决策的问题做出相应的决定，那么，这项工作就有非常大的可能被人工智能技术全部或部分取代。

如果你的工作涉及缜密的思考、周全的推理或复杂的决策，每个具体判断并非人脑可以在5秒钟的时间内完成，那么，以目前的技术来说，你的工作是很难被机器取代的。

当然，这里说的“五秒钟准则”只是个经验法则，我们可以举出许多并不符合这一准则的个例。

基于“五秒钟准则”，我个人预测，从事翻译、新闻报道、助理、保安、销售、客服、交易、会计、司机、家政等工作的人，未来10年将有约90%被人工智能全部或部分取代。如果就全人类的工作进行一个粗略的估计，我的预测是，约50%的人类工作会受到人工智能的影响。

大部分工作将发生转变而非消失

技术让银行变得更加高效，更易扩展。银行可以开更多的支行，雇用更多的员工，在新的领域投资并制造新的工作机会。

ATM的普及不仅没有造成银行柜员人数的下降，反而给银行提供了拓展业务的契机，银行柜员的工作转变为新的形式后，银行对于柜员的需求也持续增加。

在杰瑞·卡普兰看来，人工智能可能取代的工作大多拥有清晰的评估标准，工作业绩可以被客观地衡量。人工智能无法取代的工作通常需要人类做出决策。例如，风险投资人仍然需要面对面地和创业者会谈，以确定投资意向。

与杰瑞·卡普兰的观点相似，我认为在人工智能时代里，人类工作的转型在所难免，但这更多意味着新的工作方式，而非大量的失业。

失业问题未必会如某些人想象的那样严重。技术发展将造成一部分简单工作、底层工作的消失或转变，但由此也会催生更多新型的、更需要人类判断力和创造力的工作类型。

AI只是人类的工具

担心人工智能控制甚至毁灭人类的，是对超人工智能过于乐观的“科幻”爱好者；担心人工智能取代绝大部分人类工作，造成全球大范围失业的，则是不相信科技进步能凭借自身力量优化社会资源分配、调整经济结构、构建新就业秩序的保守主义者。

最有可能变成现实的情形是全人类步入一个崭新的人机协作时代，在这个时代，以人工智能为驱动的机器将大幅提高人类的工作效率，但无论从哪个角度说，机器都只是人类的工具。

AI只是人类的工具。技术本身不是问题，问题是我们如何使用技术以及如何围绕人工智能这样一种革命性的新科技，建立与之配合的社会和经济结构，用制度来保证人人都可享用人工智能带来的巨大收益，同时不必担心失业等潜在风险。

自动驾驶：AI最大的应用场景

自从谷歌正式对外宣布自动驾驶汽车项目以来，自动驾驶行业已呈现出整体布局、多元配置、多角度切入的格局，5到10年后可具备千亿美元乃至万亿美元规模的庞大产业生态已具雏形。

因为智能调度算法的帮助，共享汽车的使用率会接近100%，城市里需要的汽车总量则会大幅减少。

停车难、大堵车等现象会因为自动驾驶共享汽车的出现而得到真正解决。

道路上，汽车和汽车之间可以通过“车联网”连接起来，完成许多有人驾驶不可能完成的工作。

未来的道路也会按照自动驾驶汽车的要求来重新设计，专用于自动驾驶的车道可以变得更窄，交通信号可以更容易被自动驾驶汽车识别。

自动驾驶的普及对产业结构、经济格局的影响将极其深远。想象一下，在过去的100多年，汽车工业是如何彻底改变了全球、全人类的生活方式，如何创造出了一大批市值百亿美元、千亿美元的大型跨国公司，如何带动了从设计、生产到零件、外包、服务、咨询、培训、交通、物流等数百个相关的生态产业，如何在短短数十年里让美国成为“车轮上的国家”，又如何在短短十几年时间里在中国小康家庭中普及了汽车出行的现代生活方式。

自动驾驶技术发展简史

1912年，人类发明的第一架固定翼飞机首飞不到10年，为飞机制造导航仪表的Sperry公司就研制出了第一套自动驾驶系统

自动驾驶装置必备的几个组成部分。
·感知单元：主要由各种传感器和智能感知算法组成，用于感知交通工具行经路线上的实时环境情况。
·决策单元：主要由控制机械、控制电路或计算机软硬件系统组成，用于根据环境信息决定对交通工具施加何种操作。
·控制单元：主要通过交通工具的控制接口，直接或间接操控交通工具的可操纵界面（如飞机的操纵面或汽车的方向盘、踏板等），完成实际的驾驶工作。
这里写图片描述
图37 自动驾驶系统的基本概念模型
1947年，美国空军用一架道格拉斯C-54运输机完成了一次横跨大西洋的飞行，飞机全程使用自动驾驶系统控制，包括起飞和降落环节，这是自动驾驶系统在航空工业中走向普及的标志性事件。

为汽车设计生产廉价、精准、可靠的传感器，是未来自动驾驶行业的重心之一。

完全不需要飞行员的无人机只在军事领域得到了广泛应用，进入大规模商业客运、货运飞行还为时尚早。

对道路的改造（如新的易于识别的交通标志、与汽车传感器配合的信号源等）也许是简化汽车自动驾驶系统实现难度的一条捷径。

在障碍检测方面，Stanley自动驾驶汽车已经使用了机器学习技术。

谷歌认为，要保证自动驾驶的绝对安全，就一定不能依赖于人的参与，必须让自动驾驶汽车的人工智能技术能够应对所有（至少是极其接近100%的）极端路况，否则，就无法销售尚有风险的汽车产品。

因为对100%自动驾驶的高标准追求，谷歌的自动驾驶汽车研发和商业化之路无法在短期内获得收益。

追求最佳的安全和行驶体验，迟迟不进行商业化的开发，这让谷歌自动驾驶团队在许多新闻评论中成了“起个大早，赶个晚集”的揶揄对象。因为产品商业化迟缓，谷歌自动驾驶团队的许多技术人员都已离开谷歌，成为各大科技企业和初创团队中研发自动驾驶技术的领军人物。

2016年12月，谷歌宣布，自动驾驶团队正式分离出来，成立了一家名叫Waymo的新公司。这一举措也许意味着谷歌自动驾驶汽车正式走向商业化的开始，也许是谷歌为了应对人才流失和市场竞争的无奈之举。

自动驾驶的六个级别

许多汽车厂商都把计算机辅助驾驶称为“自动驾驶”

为了更好地区分不同层级的自动驾驶技术，国际汽车工程师学会（SAE International）于2014年发布了自动驾驶的六级分类体系
这里写图片描述
在SAE定义的第3级技术标准中，监控路况的任务由自动驾驶系统来完成。这个差别是巨大的。技术人员也通常将第2级和第3级之间的分界线，视作“辅助驾驶”和“自动驾驶”的区别所在。

这次志愿者测试项目让谷歌自动驾驶团队明白了一点：一旦自动驾驶汽车达到了足够高的水平，车内乘客就会想当然地将所有操控权交给汽车。无论这时候自动驾驶汽车的软件是否还有风险，无论路面上那些极端的路况是不是能被自动驾驶汽车正确处理，车主都不会保持100%的高度警觉。

也就是说，第3级的自动驾驶，目前还很难被不受限制地应用于所有场景。

从商业化的视角来看，第2级或第3级的自动驾驶技术，将来只会被用于有限的场合，而直接面向第4级甚至第5级的自动驾驶，才是未来最大的商业机会。

自动驾驶的普及：中国有机会扮演关键角色

技术方面，谷歌（Waymo）的自动驾驶系统非常成熟，已经接近商用，也许只要一两年的时间，就可以达到SAE第4级和第5级的标准。但在非技术领域，政府、公众、企业还必须考虑诸多政策的、法律的、经济的、心理的甚至是道德层面的问题。

首先，现有的法律制度、政策、保险体系等，并不是为自动驾驶时代的交通量身定制的，一定存在诸多不合理之处。对于法律体系的改进和完善，一定不要以今天的眼光去预测未来的科技。

其次，道德问题始终是制约自动驾驶商业化和大规模普及的关键因素。美国人比较喜欢用一个处于两难境地的道德测试来衡量自动驾驶的合理与否，这个测试叫作“有轨电车难题”（Trolley problem）。

另一个困扰自动驾驶技术商业化的因素是失业问题对传统行业的冲击。而这种冲击，也因不同地方、不同人群而存在巨大差别。

欧盟对自动驾驶技术的要求是，不能用迭代、不断改进的心态去开发自动驾驶软件，而是要第一个商用版本就做到足够安全。

首先，中国是一个快速发展的国家，在全国和城市的交通路网建设上，一直处于不断建设、不断更新的状态。中国比其他任何一个国家都容易从道路建设的角度入手，为自动驾驶汽车配备专用的路面、交通标志甚至制定有针对性的交通法规。这可以弥补自动驾驶技术本身的许多缺陷，将自动驾驶技术发生事故的风险大幅降低。

其次，中国在尝试新科技方面的阻力没有美国那么大，中国政府集中力量支持技术突破的能力也远比美国政府要强。
技术迭代就可以更快速地完成，在中国做自动驾驶相关的科研，就会比在美国或欧洲更容易拿到好的数据、找到好的测试场景，这对自动驾驶在未来的进一步发展十分重要。

再次，中国在评估自动驾驶系统带来的伦理道德问题时，通常会比美国政府、公众的态度更为务实。

自动驾驶技术可以非常容易地将家庭用车模式转变为共享用车的模式。自动驾驶汽车随叫随到，每个家庭不需要长期保有自己的车辆，也不需要购置停车场地。通过基于自动驾驶的分享经济，中国可以大幅减少汽车的保有量，从根本上解决交通堵塞和汽车尾气污染等问题。

自动驾驶将是中国未来10年科技发展面临的最重要的机遇之一。中国有全球最大的交通路网、最大的人口基数，自动驾驶的大规模商业化和技术普及反过来会促进自动驾驶相关科研的飞跃式发展。这种从科研到应用，从应用再反馈到科研的良性循环，正是中国能否在未来10年内，建立起世界先进水平的人工智能科技体系的关键。

智慧金融：AI目前最被看好的落地领域

雇用大量交易员在集中场所进行资产交易的方式，正在从我们这个地球上消失。

人类交易员大量被机器算法所取代，这只是人工智能正在智慧金融建设中发挥重要作用的冰山一角。事实上，包括银行、保险、证券等在内的整个金融行业，都已经并正在发生着用人工智能改进现有流程，提高业务效率，大幅增加收入或降低成本的巨大变革。2017年，据彭博社报道，摩根大通开发了一款金融合同解析软件COIN，已经上线半年多。经测试，原先律师和贷款人员每年累计需要36万小时才能完成的工作，COIN只需几秒就能完成。而且，COIN不仅在“工作”时错误率低，还不用放假。

判断人工智能技术能在哪个行业最先引起革命性的变革，除了要看这个行业对自动化、智能化的内在需求外，主要还要看这个行业内的数据积累、数据流转、数据存储和数据更新是不是达到了深度学习算法对大数据的要求。

而基于深度学习的人工智能算法显然可以在数据分析与数据预测的准确度上，超出人类分析员好几个数量级。

根据高盛公司的评估，金融行业里，最有可能应用人工智能技术的领域主要包括：
·量化交易与智能投顾
·风险防控
·安防与客户身份认证
·智能客服
·精准营销
这里写图片描述
图46　银行业中，人工智能相关应用场景一览

金融行业AI应用成功案例

第一个以人工智能驱动的基金Rebellion曾成功预测了2008年股市崩盘，并在2009年给希腊债券F评级，而当时惠誉的评级仍然为A，通过人工智能，Rebellion比官方降级提前一个月；掌管900亿美元的对冲基金Cerebellum，使用了人工智能技术，从2009年以来一直处于盈利状态。

在国内，蚂蚁金服已成功将人工智能运用于互联网小贷、保险、征信、资产配置、客户服务等领域；智融金服利用人工智能风控系统已经实现月均120万笔以上的放款，常规机器审核速度用时仅8秒；招商银行的可视化柜台、交通银行推出的人工智能机器人“娇娇”等则在智能客服领域做出了早期的尝试和探索。

用钱宝之所以能在保证风险可控的情况下高速增长，最关键的秘密只有一个——用机器学习技术自动分析包含大量强特征和弱特征的数据，自动判断交易风险。

如果把一个人的数据比作一座冰山，那么强特征数据仅是冰山的一角，之下还存在海量的弱特征数据，例如电商数据、设备数据、位置数据、行为数据等。同时，作为百业之母的金融行业与整个社会存在巨大的交织网络，本身沉淀了大量有用或者无用数据，其中包括各类金融交易、客户信息、市场分析、风险控制、投资顾问等。这些数据单位都是海量级，且大量数据又以非结构化的方式存在，无法转换成传统模型可有效分析的数据。

以深度学习为代表的人工智能算法所要做的，就是充分挖掘并有效地利用这些海量弱特征数据，建立起更加符合真实世界规律的数学模型。

未来的金融科技必将是互联网与AI的有机结合，由此产生的智慧金融服务将成为每个人生活的重要组成部分。

AI科学家的土豪人生

成功的机器翻译系统比如谷歌翻译走的都是统计模型的道路（今天更是在统计模型的基础上增加了深度学习这个高级武器）。

别人的人生到达顶峰，鲍勃和彼得的人生才刚开始。他们的人生目标不是赚一个亿，而是赚十个亿，一百个亿，甚至更多——而且，是运用计算机科学的方法，借助计算机科学家特有的敏锐头脑和人工智能知识。

据说，詹姆斯·西蒙斯招人的条件颇为严格，一定要找最聪明的数学家或计算机科学家，坚决不找学金融的、学工商管理的。文艺复兴科技的公司内部，基本上就是一个极客乐园，一点儿也没有华尔街那些世俗金融企业的影子。1993年，鲍勃·默瑟和彼得·布朗这两个在人工智能领域已经颇有名气的研究员被詹姆斯·西蒙斯招至麾下，开始和文艺复兴科技里的数学家、计算机科学家一道，用人工智能技术投资理财，走上了光芒万丈的财富之路。

从大学校园和IBM研究中心走出来的计算机科学家领导一家基金公司，这件事在华尔街并不算新鲜，但在不熟悉金融圈、投资圈的码农们看来，确实有些不可思议。科学家和财富之间，什么样的关系才最和谐？

智慧生活：从机器翻译到智能超市

与机器视觉、语音识别取得的突破相比，人工智能对人类语言的理解目前还处在相对滞后的阶段。基于深度学习的人工智能算法已经可以十分准确地完成“听写”或“看图识字”的操作，但对听到的、看到的文字的意思，机器还是比较难以准确掌握。

未来5到10年里，在自然语言理解方面，也许最可能取得重大突破的就是机器翻译。

C-3PO机器人预示的未来，真的离我们很远吗？一旦机器翻译技术在不断积累的基础上突破了人类可接受的心理阈值，达到了人类翻译的水准，那时，我们有何必要花费生命中大约五分之一的时间去学习和精通一两门甚至更多门的外语？我们有何必要雇用如此多的翻译职员？出门旅行，出国参与商务或学术活动的时候，带上一部安装了机器翻译程序的手机，不就可以与外国人顺利沟通了吗？

今天的微软小冰、苹果Siri等对话机器人，还远远不能达到“聪明”的程度，因为它们无法深入理解人类语言的含义。

亚马逊Echo音箱只是亚马逊的智能会话系统与用户交流的一个终端。实际上，用户对Echo说的话，都会被上传到亚马逊的Alexa服务进行解析。这样一来，亚马逊的Alexa服务就有能力收集到越来越多的真实用户交互样本。基于这种方式，亚马逊很快就可以建立起非常庞大的用户交互行为数据集，在这个数据集的基础上，用机器学习算法不断迭代，取得重大的技术突破只是时间问题。

亚马逊在人工智能方面的许多尝试都让人眼前一亮。2016年年底，亚马逊宣布了一个几乎震惊整个科技界的大新闻：亚马逊开办了一家不用排队、不用结账、拿了东西就可以走人的小超市，名字叫亚马逊Go！

这是一家利用人工智能技术管理的小超市。

从机器翻译到智能家电，再到智能超市，人工智能技术给我们生活带来的巨大变化才刚刚开始。

其实，如果回到10年以前，2007年苹果才刚刚发布第一代iPhone手机，那时谁会想到只用了10年的时间，智能手机就无处不在了呢？

智慧医疗：AI将成为医生的好帮手

今天，在制药领域，以深度学习为代表的人工智能技术可以发挥比六七十年代时大得多的作用。一家总部位于伦敦的名叫Benevolent AI的创业公司，就在做一个有趣的尝试：他们让人工智能系统阅读存储在专利数据库、医疗数据库、化学数据库中的专利、数据、技术资料，以及发表在医药学期刊上的论文，通过机器学习来寻找潜在的可用于制造新药的分子式或配方。

大数据和基于大数据的人工智能，为医生辅助诊断疾病提供了最好的支持。

2017年2月，发表在《自然》杂志上的一篇论文介绍了一次有关皮肤癌诊断的人与机器的“较量”。在该论文所揭示的研究中，科学家们让一个卷积神经网络分析了将近13万张临床上的皮肤癌图片，这个数字比现在最大的研究用图片集高出了两个数量级。在大量学习资料的支持下，这个神经网络迅速成为一名皮肤癌方面的专家。

研究者让这个计算机皮肤癌专家与21名资深的皮肤科医生“同场竞技”。

用AI来辅助疾病诊断，并不是要在所有领域都超越顶尖医生。其实，AI可以给经验不足的医生提供帮助，减少因为经验欠缺而造成的误诊。或者，AI可以帮助医生提高判读医疗影像、病理化验结果的效率，让高明的医生可以在相同时间内给更多的病人提供服务。

在AI的帮助下，我们看到的不会是医生失业，而是同样数量的医生可以服务几倍、数十倍甚至更多的人群。

机器学习算法竞赛平台Kaggle于2017年3月被谷歌收购，成为谷歌云服务平台的一部分，这从另一方面展示了数据与算法竞赛对于人工智能科研的重要性。

艺术创作：AI与人类各擅胜场

目前的人工智能更擅长从大量数据中发现规律，帮助人类完成那些人类只需要简单思考就能做出决策的重复性工作。而人类相比人工智能的一个优势是人类有情感、明善恶、懂美丑，更擅长从事对创造性要求很高的文艺类工作。但这只是从普遍规律的角度来区分机器与人的最大不同。

人工智能算法会画画，能作曲，懂书法，能填词赋诗，还会写春联，这在普通人看来，是非常了不起的成就。这是不是意味着，人工智能和人一样有意识、有创造力、有情感、有思想了呢？

人类将如何变革？

走出金字塔模型

从刀耕火种时代至今，人类历史上的协作分工，基本都遵循一个类似金字塔形状的社会结构模型：少数人影响、领导和指挥较多的人，较多的人再进一步影响或管理更多的人，逐级向下，金字塔底层是大量从事简单、重复性劳动的人。

金字塔结构不一定坍塌，更多的可能是在现有基础上进行自我调整。因为人工智能虽将引起社会工作结构的大规模调整，但调整的结果不等于大量从事简单工作的人必须去勉为其难地完成高层次的分析、决策、艺术等创造性的工作。即便是处在金字塔中层或顶层的人，也将面临人工智能技术的冲击，他们也需要重新适应。

在谷歌，大多数技术管理者同时也是软件开发者，不但做分析、决策，也实际动手写代码，而许多实际写代码的工程师也会花时间参与项目中的关键技术决策。与微软对人才的要求不同，谷歌公司总是强调，不同岗位、不同层级的人都需要是最优秀的精英人才，这样，谷歌在需要做任何技术或商业转型时，都很容易重新安排工作的分配方式，因为优秀的人才总能快速学会另一项技能，或快速适应新的岗位。这一体系，相信在人工智能时代受到的冲击会很小。

不难预测，随着人工智能技术的普及，类似谷歌公司这样，可以灵活配置资源、灵活转换方向的管理体系会越来越受到公司领导者的青睐。

·在人工智能时代，我们需要教育父母，让他们不要再期望孩子寻找“安稳”的工作，因为在传统意义上，“安稳”意味着简单、重复，“安稳”的工作早晚都会被机器取代。我们要帮助下一代做最智慧的选择，选择那些相对不容易被淘汰，或者可以与机器协同完成任务的工作。

用开放的心态迎接新世界

李飞飞提出，人类未来的一个重要目标，是增强人工智能研究者的多样性。这是基于三个层面的考虑：“第一个理由关乎经济和劳动力，人工智能是一个日益增长的技术，会影响到每个人，我们需要更多人力开发出更好的技术；第二个理由关乎创造力和创新，很多研究都显示出，当拥有多种多样背景的人共同合作时，会产生更好的结果和更具有创意的解决方案；最后一个理由关乎社会正义和道德价值，当各种各样背景的人聚集到一起时，他们有着各种各样不同的价值观，代表着人类的技术也会有更加多样性的思考。”

李飞飞敏锐地从另一个角度看到了人工智能未来发展的一种可能：当拥有多样化背景、多种价值观、对未来有不同诉求的人一起参与人工智能的研发与普及时，我们最容易得到一个趋近完美的平衡点，找到人工智能与人类协同工作、生活、生存的多样化解决方案，避免被偏见所左右。这也许是我们目前能想到的，避免潜在危机，防范风险的最好方案。

只有人的精神个性，才是人工智能时代里人类的真正价值。只有用开放的心态，创造性地迎接人工智能与人类协同工作的新世界，才能真正成为未来的主人。

第五章机遇来临：AI先行的创新与创业

大多数情况下，人工智能并不是一种全新的业务流程或全新的商业模式，而是对现有业务流程、商业模式的根本性改造。AI重在提升效率，而非发明新流程、新业务。未来10年，不仅仅是高科技领域，任何一个企业，如果不尽早为自己的业务流程引入“AI+”的先进思维方式，就很容易处于落后的追随者地位。

大时代，大格局

人工智能来了，普通公众看到的是智能应用的惊艳，科技公司看到的是大势所趋的必然，传统行业看到的是产业升级的潜力，国家层面看到的是技术革命的未来。

今天，“互联网+”的理念已经向各行业、各应用的纵深不断渗透、落地，逐渐积累起来的高质量大数据为许多前沿行业打下了全面运用人工智能的基础。我们有理由说，“AI+”或“+AI”的模式已经步入蓬勃发展的大好时机。

AI将成为国家科技战略的核心方向

其实，对人工智能大趋势、大格局的重视已经开始从社会层面上升到国家层面。2016年5月，国家发改委、科技部、工业和信息化部、中央网信办就联合制定了《“互联网+”人工智能三年行动实施方案》。2017年3月，第十二届全国人民代表大会第五次会议所做的政府工作报告更是明确提出，国家将加快人工智能等新兴产业的技术研发和转化。
斯坦福大学这份报告首先列举了当前的人工智能热门研究领域，包括大规模机器学习、深度学习、强化学习、机器人、计算机视觉、自然语言处理、协同系统、众包和人类计算、算法博弈理论与计算机社会选择、物联网（IOT）、神经形态计算等。

高盛认为，人工智能在四个方面的影响力最为显著：
生产率
尖端技术
竞争优势
创办新公司

人工智能的大部分价值都掌握在具有资源、数据和投资能力的大公司手中

考虑到人工智能已经进入一个最为重要的发展时期，美国政府需要为科研、产业、教育等领域的相关发展提供一个战略方向上的指导。为此，《国家人工智能研究与发展策略规划》提出了七个重点战略方向：
策略1：对人工智能研发进行长期投资。
策略2：开发有效的“人—人工智能”协作方式。
策略3：理解并应对人工智能带来的伦理、法律和社会影响。
策略4：确保人工智能系统的安全。
策略5：开发人工智能共享公共数据集和测试环境平台。
策略6：建立标准和基准评估人工智能技术。
策略7：更好地了解国家对人工智能研发人才的需求。

《人工智能时代》的作者杰瑞·卡普兰就完全不相信美国政府发布的所谓战略规划能有多大的约束力。

杰瑞·卡普兰认为，当我们看到美国政府的类似计划时，我们必须持一种怀疑的态度。美国所谓的政策，很多时候不过是一群拥有美好愿望的人召开了一次政府会议，并发布了一些相关文件。

从谷歌的“AI先行”看科技企业的AI战略

谷歌之所以为谷歌，最重要的是，无论在哪一次重大的技术变革中，谷歌几乎都能敏锐地捕捉到先机，早早建立起领先竞争对手一两年乃至三五年的巨大技术优势。

谷歌大脑的意义，绝不仅仅是打造了一个可以进行深度学习计算的高性能平台这么简单。实际上，随着谷歌大脑成为谷歌内部越来越多技术项目的基石，谷歌也自然而然地喊出了“AI先行”（AI First）的战略口号。

所有这些围绕人工智能技术建立的战略方向，让整个Alphabet集团变成了世界上最大的AI平台！

深度学习天生青睐于显卡中图形处理器（GPU）的强大计算能力，英伟达公司在AI时代一跃成为比英特尔CPU还要抢眼的核心驱动力。

2016年11月，Facebook宣布，贾扬清的技术团队基于Caffe开发了一个基于移动设备的深度学习框架Caffe2go，首次在运算能力受限的手机上实现了实时的图像与视频捕获，以及后续基于深度学习的分析、处理。贾扬清说：“随着我们的不断进步，你可以想象，可以在（移动）设备上运行的实时AI技术将能帮助这个世界变得更加开放，让人与人之间的联系得以加强，特别是在无障碍应用和教育等领域。可以拿在手上的智能设备将会持续地改变我们对智能的定义。”

科技“巨头”的潜在威胁

AI时代，数据为王

谷歌等行业巨头坐享地球上最为丰富的大数据资源，利用这些庞大数据资源帮助人类克服挑战、解决问题当然最为理想，但谁又能从法律、道德等层面保证，对这些大数据资源的垄断不会成为行业巨头谋求一己私利的壁垒与工具？

大企业在AI领域拥有几个巨大的优势：
懂得如何创建AI系统的人数非常有限。大企业可以为他们支付比创业公司更多的薪酬，就像雇用体育明星。大企业差不多可以把他们都收入麾下，留给其他企业的人才将少之又少。

AI项目通常都非常大、非常复杂。

亚马逊的Echo智能音箱是大约1500名工程师开发4年才完成的（注：马克·安德森这里说的工程师人数应该是有些夸大了，亚马逊CEO杰夫·贝索斯2016年5月在另一个场合的说法是：经过4年发展，Echo团队目前已有超过1000名员工）。

需要巨大数量的数据集来创建AI应用。

谷歌和Facebook之类的大型企业可以访问浩如烟海的数据资源，而创业公司则只能望洋兴叹。

2016年9月，谷歌（包括Deep Mind）、亚马逊、Facebook、IBM和微软等甚至结成了AI联盟（Partnership of Artificial Intelligence）

巨头联盟只会加剧资源的进一步集中甚至是封闭。

举个例子，假如Facebook借助庞大的社交网络资源，希望通过智能算法主动引导信息流动，并进而影响美国总统大选时的选民倾向，这在技术上几乎是完全可行的。我们当然知道，目前的谷歌、Facebook等巨头对人类的实际贡献远多于它们“作恶”的可能性，但从法律、道德角度，我们又必须想办法防范这一潜在风险。因为再友善的巨头本质上也是商业公司，巨大的商业利益永远是诱惑它们“作恶”的诱饵。

谷歌开源的Tensor Flow框架，已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里，连续开源You Tube 8M、Open Images、Audio Set等包含数百万份视频、图片、音频的标注数据集，为人工智能领域的科研发展提供“原材料”。

巨头建立的AI平台以及巨头之间的结盟关系，有可能让数字鸿沟变得越来越严重。

对于这样的“巨头风险”，我觉得我们应该从法律和制度建设层面，多做些有前瞻性的事情，包括：
·提高大数据和人工智能应用领域的透明度，鼓励公开那些不涉及用户隐私和商业机密的研发成果，鼓励开源。
·更多地鼓励利用区块链技术管理数据和信息流动，从技术和制度双方面打破科技巨头对大数据的垄断。
·成立有社会责任感的VC基金，专注于新兴的大数据和人工智能方向。
·多关注能够帮助落后人群获取信息、享受AI福利的平台。
·鼓励大众和媒体去监督行业巨头的商业行为。

对于较小企业，进入AI市场的难度的确比移动互联网时代的创业高出非常多。

巨头垄断大数据资源、垄断科研与舆论的风险客观存在。而在国家政策层面、法律法规层面甚至道德层面，我们还缺乏应对这种潜在风险的有效体系。

AI创业是时代的最强音

伟大的创业需要生逢其时

创业大潮里，有的创业者脱颖而出，有的创业者负重前行。我们虽不以成败论英雄，但如果一定要找一条诞生伟大公司的必要条件，我会选择“生逢其时”。

雷军创立小米的传奇让“风口论”深入人心——只要站在风口，猪也能飞起来。有人说，这是绝对的机会主义。但在创业的时代大潮中，是否符合科技大趋势的确是决定创业成败的第一要素。

未来四五年对于人工智能时代的意义，和20世纪70年代、80年代对于PC时代的意义相比，绝对毫不逊色。几乎可以预言，如果人工智能时代也会出现苹果、微软、谷歌、百度、阿里、腾讯等伟大公司的话，那么，这些伟大公司一定会有相当数量是在这四五年里创立的。

加拿大是人工智能创业的“科研型孵化器”。深度学习三巨头中，杰弗里·辛顿和约书亚·本吉奥都在加拿大的大学教书，这直接促成了加拿大极为出色的人工智能研究氛围。

根据《乌镇指数：全球人工智能发展报告2016》的统计：人工智能领域，美国与欧洲投资较为密集，数量较多，其次为中国、印度、以色列。美国共获得3450多笔投资，位列全球第一；英国获得274笔投资，位列第二；中国则以146笔投资位列第三。美国人工智能企业总数为2905家，全球第一。仅加州的旧金山/湾区、大洛杉矶地区两地的企业数量即达到1155家，占全球的19.13%。

AI时代，最大“风口”就是人工智能本身。肯定不是所有猪都能在风口飞起来，但要做一飞冲天的创业英雄，就一定要看准科技大势，选择最正确的时机做最正确的事。

人工智能的商业化路线图

本质上，过去20年的互联网和移动互联网是一个不断将线上、线下的业务场景紧密连接，同时也不断促使数据产生、流转、集中和再利用的过程。

从投资人的角度看，AI兴起的最大契机还不是深度学习技术的发明，而是过去20年互联网、移动互联网的高速发展对自动化的强烈需求。

创新工场管理合伙人、资深投资人汪华认为，人工智能的商业化大致可分为三个主要阶段：
第一阶段，AI会率先在那些在线化程度高的行业开始应用，在数据端、媒体端实现自动化。
第二阶段，随着感知技术、传感器和机器人技术的发展，AI会延伸到实体世界，并率先在专业领域、行业应用、生产力端实现线下业务的自动化。
第三阶段，当成本技术进一步成熟时，AI会延伸到个人场景，全面自动化的时代终将到来。
根据汪华的判断，我们目前正在进入AI商业化的第一个阶段，也许只需要3年左右的时间，AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段，要花五六年、六七年的时间才能充分发展起来。而标志着全面自动化的第三阶段，也许需要十几年或更长的时间。

AI创业的五大基石

这里写图片描述
图58　人工智能创业的五大基石
·清晰的领域界限
·闭环的、自动标注的数据
·千万级的数据量
·超大规模的计算能力
·顶尖的AI科学家

AI创业的泡沫现象及六大挑战

在智能医疗领域，今后可以成功的初创公司，一定是那些既懂人工智能算法，又特别了解医疗行业，可以收集到高质量医疗数据的公司。

概括来说，目前的人工智能产业发展面临六大挑战：
一、前沿科研与产业实践尚未紧密衔接
二、人才缺口巨大，人才结构失衡
据Linked In统计，全球目前拥有约25万名人工智能专业人才，其中美国约占三分之一
人才供需矛盾显著，高级算法工程师、研究员和科学家的身价持续走高。人才结构方面，高端人才、中坚力量和基础人才间的数量比例远未达到最优。
三、数据孤岛化和碎片化问题明显
四、可复用和标准化的技术框架、平台、工具、服务尚未成熟
一个完整人工智能生态所必备的，从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作，尚需3年或更长时间才能真正成熟。
五、一些领域存在超前发展、盲目投资等问题
六、创业难度相对较高，早期创业团队需要更多支持
对高级人才较为依赖，科学家创业者自身的商业实践经验较少，高质量大数据较难获得，深度学习计算单元和计算集群的价格十分昂贵，等等。

AI是中国创新、创业的最好机会

总体来说，目前的人工智能大格局中，机遇是主旋律，泡沫和危机是必须克服的局部挑战。这一格局在全球如此，在中国亦如此。

人工智能时代，中国的人才优势、市场优势、资金优势、坚持多年创新的商业模式优势等，都是人工智能最好的生长土壤。

AI领域，中国人/华人已是科研中坚

根据创新工场的统计，在2006年到2016年的时间段里，近两万篇顶级的人工智能文章中，由华人贡献的文章数和被引用数，分别占全部数字的29.2%和31.8%。

但从突破性科研贡献的数量和质量上说，中国还无法与美国相比。

中国有独具优势的AI创业环境

中国学生普遍理工科较强，数学较强。这在人工智能时代里，显然有巨大的优势。

同时，即便是没有专门去学计算机科学的学生，他们中有很多已经具备了非常扎实的数学知识，这些学生在需要时可以通过培训，较快地成为掌握深度学习等人工智能技术的算法工程师。

行业需求方面，中国的传统行业较为薄弱，但这种状况反而给中国带来了一种后发优势。

尽管美国人工智能企业领先全球，但它们要想进入中国市场必须跨越重重阻碍，因为中国市场需要的是最“接地气”的本地化解决方案。此外，对于人工智能的探索性和试用性需求，中国往往会采取相对开放和鼓励的路线，这也可能促进行业的超速发展。

中国虽然在人工智能的前沿研发中不如美国，但中国有独具优势的AI科研和创业环境，有机会实现弯道超车，后发先至。

AI黄埔军校——微软亚洲研究院

1999年加入微软亚洲研究院的张宏江是视频检索领域的“开山鼻祖”。张宏江在微软亚洲研究院期间，就曾带领和指导视觉计算组解决人脸识别的问题。

今天，人脸识别在中国的金融和安防两个垂直领域得到了广泛应用

创新工场的AI布局

这里写图片描述
图64　创新工场在人工智能领域的投资布局
创新工场还宣布成立人工智能工程院。这是一个专门面向人工智能的创业人才培养基地和创业项目孵化实验室，其使命是为人工智能创业提供人才与技术、产品和商业经验、市场推广、软硬件平台、高质量大数据源等多方位的支持。

创新工场人工智能工程院的主要工作任务包括：
·对接科研成果与商业实践，帮助海内外顶级人工智能人才创业
·培育和孵化高水准的人工智能技术团队
·积累和建设人工智能数据集，促进大数据的有序聚合和合理利用
·开展广泛合作，促进人工智能产业的可持续发展

第六章迎接未来：AI时代的教育和个人发展

人工智能时代，程式化的、重复性的、仅靠记忆与练习就可以掌握的技能将是最没有价值的技能，几乎一定可以由机器来完成；反之，那些最能体现人的综合素质的技能，例如，人对于复杂系统的综合分析、决策能力，对于艺术和文化的审美能力和创造性思维，由生活经验及文化熏陶产生的直觉、常识，基于人自身的情感（爱、恨、热情、冷漠等）与他人互动的能力……这些是人工智能时代最有价值，最值得培养、学习的技能。

AI时代该如何学习？

密涅瓦大学使用的是一套名为“沉浸式全球化体验”（Global Immersion）的教学方式。
密涅瓦大学的一年级课程直接将知识课程与四种极其重要的方法论有机结合起来，变成形式分析、实证分析、多元模式交流、复杂系统四大课程板块。
这里写图片描述
图65　密涅瓦大学一年级的四个课程方向
在清华大学，姚期智院士创办的清华学堂计算机科学实验班（又称“姚班”）就是其中很有代表性的一个。

敢于挑战自己，敢于面对有趣的、有难度的问题，这是姚班这种新型教育氛围较容易培养出来的学生特质，而具备这种特质的学生，最容易在人工智能时代作为人类智慧的代表，设计最高效的AI系统，并与AI系统一起创造更大价值。

如果要我来总结的话，我觉得，人工智能时代最核心、最有效的学习方法包括：
·主动挑战极限
·从实践中学习（Learning by doing）
·关注启发式教育，培养创造力和独立解决问题的能力
·虽然面对面的课堂仍将存在，但互动式的在线学习将愈来愈重要
·主动向机器学习
·既学习人—人协作，也学习人—机协作
·学习要追随兴趣