第四次产业革命源于人工智能（趋势解读20k字）

最新推荐文章于 2020-08-25 09:23:53 发布

秦陇纪10数据简化DataSimp

最新推荐文章于 2020-08-25 09:23:53 发布

阅读量3.2k

点赞数 2

分类专栏：人工智能文章标签： AI 人工智能秦陇纪第四次工业革命

本文链接：https://blog.csdn.net/qq_28260611/article/details/58127648

版权

第四次产业革命源于人工智能（趋势解读20k字）

秦陇纪10汇编

A. 第四次产业革命：始于人工智能(6.7k字)

B. 人工智能将带来第四次产业革命(3.3k字)

C. 人工智能2.0时代序幕开启书(6.5k字)

D. 第四次产业革命之人工智能常识和机遇(4.8k字)

E. 数据简化DataSimp技术描述、学会及社区(1k字)

第四次产业革命源于人工智能（趋势解读20k字），通过对第四次产业革命、人工智能概念常识、应用类型、产业概述，让大家认识到当今趋势及人工智能细分领域机遇所在；附“数据简化DataSimp”技术描述、学会及社区1k字。欢迎关注、收藏、转发新媒体“数据简化DataSimp、科学Sciences”微信号、头条号，转载请写出处：秦陇纪10“数据简化DataSimp、科学Sciences”公众号、头条号译编，投稿QinDragon2010@qq.com也欢迎加入。

A. 第四次产业革命：始于人工智能(6.7k字)

文章摘要：谷歌首席执行官桑达尔▪披猜2016年底说「最近十年，我们一直在建立一个移动优先（mobile-first）的世界，而接下来的十年里，我们的将转向人工智能优先（AI-first）的世界。」原文作者：David Kelnar，译者：徐婧欣，标签:深度学习、机器学习、人工智能。

「最近十年，我们一直在建立一个移动优先（mobile-first）的世界，而接下来的十年里，我们的将转向人工智能优先（AI-first）的世界。」（Google CEO Sundar Pichai，2016年10月）

从Amazon和Facebook到Google和Microsoft，世界上最具影响力的技术公司的领导者都在表现出了对人工智能（AI）极大的热爱。那么什么是AI？为什么如此重要？为什么会在现在成为热点？虽然人们对于AI越来越感兴趣，但是只有专家才能真正能够理解这个领域。我们的目标是使更多人接触到这个重要领域。

首先我们要解释AI以及「机器学习」等关键术语的含义，阐述成果最丰富的AI领域「深度学习」是如何运作的，并对AI解决的问题及为什么这些问题很重要进行探索。我们还会分析，为什么二十世纪五十年代发明的AI技术会在今天迎来它的时代。

作为风险投资人，我们一直在寻找能够为客户和公司创造价值的新潮流。我们相信AI会是一种比移动化和云计算更重要的变革。Amazon的CEO Jeff Bezos表示，「很难说在接下来的20年，AI会对社会造成怎样的影响。」无论你是客户、行政人员、企业家还是投资人，我们希望这篇文章能够不同于那些天花乱坠的宣传，真正为你解释为什么这个新型潮流对我们来说如此重要。

一、什么是AI？

人工智能：关于智能程序的科学。

1956年，达特茅斯学院的助理教授John McCarthy创造了「人工智能」（AI）一词，指那些能够表现出智能行为的硬件和软件，用John McCarthy的话说，就是「制造智能机器，尤其是智能计算机程序的科学和工程。」

基础的「AI」已经存在了几十年，在特定环境下通过基于一定规则的程序呈现基本的智能行为。但是取得的成绩是有限的，因为用于处理很多现实世界问题的算法是很难人工进行编程的。

在进行医疗诊断、预测机器故障或是测定特定资产的市场价值等复杂活动时，会涉及到上千个数据组和变量之间的非线性关系。在这些情况下，我们很难用现有的数据得到「最佳」预测结果。而在其他领域，包括在图像中识别目标和语言翻译等，我们甚至无法创建规则来描述我们寻求的特征。我们怎么可能编写一组适用于所有情形的程序，来描述一只小狗的外貌呢？

进行数据优化和功能特征等复杂的预测时会遇到一些困难，假使我们将这种困难由程序员那里转移到程序呢？这就是现代人工智能的责任。

机器学习也属于AI技术，所有机器学习都属于AI，但AI并不只是机器学习（见表一）。从人们对AI的兴趣可以看出对机器学习的热情，这一领域的发展非常迅速并且意义重大。

有些问题对于人类来说非常复杂，而机器学习可以帮助我们将一部分负担转移给算法，来解决这些问题。1959年，AI的先驱Arthur Samuel曾经写道，机器学习是「一种赋予计算机无需明确编程就能学习的能力的研究领域」。

大部分机器学习的目标都是针对特定使用情况开发预测引擎。算法会接收到某一领域（比如一个人在过去看过的电影）的信息，对投入进行权衡，做出有用的预测（一个人在未来喜欢不同电影的可能性）。通过赋予「计算机学习的能力」，可以利用算法完成最优化的任务，最优化也就是通过衡量可用数据中的变量，对未来进行准确预测。我们还可以更进一步，将特征详述的任务也交给程序来做。

机器学习算法要经过训练。算法首先接收到例子，并且已知这些例子的输出，记录下预测输出与真实输出的差距并调整输入的权重提高预测的准确性，直到得出最优值。因此，机器学习算法最典型的特征就是，预测的质量会随着经验的丰富而提升。我们提供的数据越多（一定程度上），预测引擎能得出的结果就越优化。（见图二、图三，需要的数据集的规模非常依赖于环境，从以下例子中我们无法笼统概括。）

机器学习的方法有超过15种，每一种都使用不同算法结构，依据得到的数据实现预测最优化。「深度学习」是其中一种方法，在新的领域取得了突破性成果，我们将在下文中对此方法进行探索。此外一些没有受到很多关注的技术也很有价值，它们适用于更广泛的使用情形。除了深度学习外，「随机森林」也是一种最有效率的机器学习算法，可以创造很多决策树，使预测最优化；

「贝叶斯网络」使用概率性方法分析变量及各变量之间的关系；在支持向量机中输入的是类别化的案例，它可以创造模型，把新的输入分配到各个类别中。

每一种方法都有优势和不足，所以要结合起来使用（一种组合方法）。哪种算法会被选择出来解决某一特定问题，取决于可用数据集等因素的性质。实践中，开发者倾向于通过实验观察哪些算法是有效果的。

机器学习的使用案例根据我们的需求和想象而不同。拥有正确的数据后，我们可以建立算法实现各种目的：根据某人之前的购买记录推荐购买产品；预测汽车装配线上的机器何时会发生故障；预测电子邮件地址是否错误；估计信用卡交易欺诈行为的可能性；还有很多其他目的。

深度学习：将特征详述工作交给算法

即使使用随机森林、贝叶斯网络、支持向量机等普通机器学习方法，也很难编写出能很好地完成特定任务的程序，从理解语音到识别图像中的对象。因为我们无法以实际、可靠的途径来详述特征。例如，如果想要编写计算机程序来识别汽车的形象，我们无法在算法中详述汽车的特征，来确保在所有情况下都能准确识别。汽车的形状、大小和颜色多种多样，位置、方向和形态也有所不同。背景、灯光和很多其他因素都会影响对象的外表。一组规则中需要包含的变量太多了，即使我们能够全部包含进去，这种解决方案也不具备延展性。我们需要为每种需要识别的对象都编写一组程序。

深度学习（DL）已经彻底改变了人工智能世界。有超过15种实现机器学习的方法，深度学习就是其中一种，所有深度学习都属于机器学习，但是机器学习并不只是深度学习。（图4）

通过深度学习，程序员可以不必完成特征详述（根据数据定义需要分析的特征）或最优化（如何权衡数据以实现准确预测）的任务，而是全部交给算法来完成。

那么如何实现这些呢？深度学习的突破点在于模拟大脑，而不是模拟世界。我们的大脑会学习做有难度的事情，比如理解话语和识别物体，而且并不是通过详尽的规则而是通过时间和反馈来学习。小的时候我们体验这个世界（比如看见一张汽车的图片），做出预测（汽车！）然后收到反馈（没错！）。我们没有通过一组详尽的规则，而是通过训练进行学习。

深度学习使用的就是这种方法。将人造的、以软件为基础的计算器连接在一起，类似于大脑中的神经元。它们组成了一个「神经网络」，接收输入并进行分析、作出判断，如果判断正确，就做出通知，如果输出是错误的，算法就会对神经元之间的联系做出调整，改变未来的预测。最初网络会出现很多次错误，但随着我们输入数以百万计的例子，神经元之间的联系就会得到调整，最终几乎在所有情形下，神经网络都会做出正确的判断，这也就是熟能生巧。

通过这个过程，我们现在可以：

识别图片中的元素；

实时语言翻译；

语音控制设备（通过 Apple Siri、Google Now、Amazon Alexa 以及 Microsoft Cortana）；

预测基因变化会对 DNA 转录产生怎样的影响；

分析客户反馈中的情感；

通过医学影像探测肿瘤。

深度学习并不能用于解决所有问题，其通常会需要利用大型数据集进行训练，需要广泛的处理能力来训练和运行神经网络。「可解释性」也是一个问题，要知道神经网络如何实现预测是非常困难的。但是深度学习使程序员从复杂的特征详述工作中解放出来，为一系列重要问题提供成功的预测机制。深度学习最终会成为AI开发者的强大工具。

二. 深度学习是如何工作的？

既然深度学习如此重要，了解其工作的基本要素也是非常有价值的。深度学习需要使用一个人工「神经网络」，即一组相互连接的「神经元」（基于软件的计算器）。

一个人工神经元至少会接收一个输入，其会以此为基础进行数学计算，得到输出结果。输出结果会依赖于每个输入的权重和神经元中的「输入-输出函数」的结构（图 5）。输入-输出函数会发生变化，神经元可能是：

一个线性单元（输出与总加权输入成一定比例）；

一个阙值单元（输出可分为两个等级，根据总输入是否高于特定值确定其等级）；或者 Sigmoid 单元（输出不断变化，与输入变化不成线性关系）。

当神经元相互连接时就会产生神经网络，一个神经元的输出会成为另一个神经元的输入（图 6）。

神经网络会组成多层神经元（所以会有「深度」学习）。「输入层（input layer）」接收信息，如一组图片，网络会对此进行处理。「输出层（output layer）」负责提供结果，多数活动都发生在输入层和输出层之间的「隐层（hidden layers）」上。神经网络上每一层的每个神经元的输出都是下一层的一个神经元的输入（图7）。