什么是深度学习？我们为何需要深度学习？

最新推荐文章于 2022-09-19 22:18:55 发布

BFT白芙堂

最新推荐文章于 2022-09-19 22:18:55 发布

阅读量992

点赞数

分类专栏：知识深度学习文章标签：人工智能机器学习算法

原文链接：https://mp.weixin.qq.com/s/ZwtUtvvKdmbs2uKvLRYZPw

版权

知识同时被 2 个专栏收录

19 篇文章 1 订阅

订阅专栏

深度学习

3 篇文章 0 订阅

订阅专栏

我们在越来越多的领域都能遇到“机器学习”、“深度学习”以及 “人工智能”等术语。但它们到底是什么意思？具体可以应用在哪里？我们又为什么需要？

名词解释

深度学习是机器学习的子领域，而机器学习是人工智能的子领域。

（一）人工智能（AI）

AI通常是指由机器（一般是计算机程序）通过模仿或复制人类行为而构造出来的体系结构。“AI”这个术语涵盖多个子领域，例如专家系统、模式分析系统或机器人。基于AI的系统会利用不同的方法来对人类行为和决策结构进行模仿或建模，有关的方法包括统计算法、启发式程序、人工神经网络(ANN)或其他机器学习衍生技术。

（二）机器学习

机器学习是AI的子领域，它由一系列自动程序组成，可以从一组示例数据推演出基本规则，即通过示例数据来“习得”规则。通过应用预定义和可理解的算法和规则，或者使用人工神经网络（如深度学习）就可以实现此技术。机器学习技术可细分为“监督式学习”和“非监督式学习”。在监督式学习中，学习的样本数据同时包含输入数据和相应的预期结果（例如分类），而在非监督式学习中，应该由系统来自行确定输入数据可能产生的结果。

（三）深度学习

深度学习是一种机器学习方法，它作为人工神经网络可以根据学习过程中的示例数据来独立地构建（训练）出基本规则。尤其是在机器视觉领域，神经网络通常采用监督式学习的方法来训练，即通过示例数据和示例数据的预定义结果来进行训练。

二、深度学习的发展历程

（一）Turing Testing

图灵测试是人工智能是否真正能够成功的一个标准，“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房间中，房间外的一个人同时询问人和计算机相同的问题，如果房间外的人无法分别哪个是人，哪个是计算机，就能够说明计算机具有人工智能。

（二）医学上的发现

1981年的诺贝尔将颁发给了David Hubel和Torsten Wiesel，以及Roger Sperry。他们发现了人的视觉系统处理信息是分级的。

从视网膜（Retina）出发，经过低级的V1区提取边缘特征，到V2区的基本形状或目标的局部，再到高层的整个目标（如判定为一张人脸），以及到更高层的PFC（前额叶皮层）进行分类判断等。也就是说高层的特征是低层特征的组合，从低层到高层的特征表达越来越抽象和概念化，也即越来越能表现语义或者意图。

边缘特征 —–> 基本形状和目标的局部特征——>整个目标这个过程其实和我们的常识是相吻合的，因为复杂的图形，往往就是由一些基本结构组合而成的。同时我们还可以看出：大脑是一个深度架构，认知过程也是深度的。

人脑神经元示意图

计算机识别图像的过程

（三）Deep Learning的出现

深度学习，恰恰就是通过组合低层特征形成更加抽象的高层特征（或属性类别）。例如，在计算机视觉领域，深度学习算法从原始图像去学习得到一个低层次表达，例如边缘检测器、小波滤波器等，然后在这些低层次表达的基础上，通过线性或者非线性组合，来获得一个高层次的表达。此外，不仅图像存在这个规律，声音也是类似的。比如，研究人员从某个声音库中通过算法自动发现了20种基本的声音结构，其余的声音都可以由这20种基本结构来合成！

三、深度学习的工作原理

（一）人工神经网络

深度学习使用了某种形式的人工神经网络(ANN)技术，因此必须先用示例数据进行训练。经过训练的ANN就可以用来执行相关任务。使用已经过训练的ANN的过程被称为“推理”。在推理时，ANN会根据习得的规则对所提供的数据进行评估。例如，可以评估输入的图像中的物体是否存在缺陷。

（二）神经元、层和连接

ANN由多个互相连接的“神经元”层组成。以最简单的情况为例，这些层具体是指输入层和输出层。可以将众多的神经元和连接看作一个矩阵。连接矩阵中包含输入矩阵的每个值，并连接到结果矩阵的值。连接矩阵的值包含了相应连接的权重。借助逻辑矩阵值以及输入值权重，可以在结果矩阵中生成相应的值。

（三）深度人工神经网络

“深度学习”指的是对深度ANN进行的训练。除了输入层和输出层外，在深度ANN的可见层之间还存在成百上千个用于输入和输出的“隐藏层”。每个隐藏层的结果矩阵即是下一层的输入矩阵。因此，只由最后一层的输出矩阵来提供结果。

（四）训练

训练ANN时，最初的焦点是随机设置的，然后逐步添加示例数据。要根据输入数据和预期结果并使用训练规则来调整关系权重。ANN的最终表现（即结果评估的精度）在很大程度上取决于训练时所用的示例数据。如果用于训练的内容有大量可变性高的示例数据，则通常能产生更精确的推理结果。如果使用大量非常相似或重复的数据进行训练，那么在遇到与示例数据不同的数据时，ANN就会无法对字段进行估算。这种情况叫做ANN的过拟合(Overfitting)。

四、深度学习可以做到哪些功能？

（一）图像分类

在图像分类应用中要将图像分配为不同的类别，例如区分有缺陷的组件与无缺陷组件，并根据不同类型的缺陷对图像进行排序，或者可用于将度假照片分配到不同的类别。在曲奇饼干的生产中，图像分类技术将检查所有饼干是否完好无损。

（二）图像分割和物体识别

图像分割可以将图像的每个像素分配给某个类别。这样就能识别出图像上的多个不同物体，例如可以识别购物篮中的不同水果，或识别交通系统中的路标、道路和的人员。此外，我们借助图像分割技术还能查看生产线上形状各异的曲奇饼干——圆形、方形或六边形。

（三）图像处理

深度学习技术还可用于处理和优化图像数据，例如，它能消除图像的干扰噪声或补偿光学透镜造成的干扰。

五、为什么需要深度学习？

如果有更多的数据，那么最好的选择就是使用性能更好的深度网络来处理。很多时候，使用的数据越多，结果就越准确。经典的ML方法需要一组复杂的ML算法，而更多的数据只会影响其精度，需要使用复杂的方法来弥补较低准确性的缺陷。此外，学习也受到影响——当添加更多的训练数据来训练模型时，学习几乎在某个时间点停止。所示的图形描述了深度学习算法与传统的机器学习算法的性能差异。

深度学习算法与经典的机器学习算法的性能比较