什么是深度学习?我们为何需要深度学习?

我们在越来越多的领域都能遇到“机器学习”、“深度学习”以及 “人工智能”等术语。但它们到底是什么意思?具体可以应用在哪里?我们又为什么需要?

名词解释

深度学习是机器学习的子领域,而机器学习是人工智能的子领域。

 (一)人工智能(AI)

AI通常是指由机器(一般是计算机程序)通过模仿或复制人类行为而构造出来的体系结构。“AI”这个术语涵盖多个子领域,例如专家系统、模式分析系统或机器人。基于AI的系统会利用不同的方法来对人类行为和决策结构进行模仿或建模,有关的方法包括统计算法、启发式程序、人工神经网络(ANN)或其他机器学习衍生技术。

(二)机器学习

机器学习是AI的子领域,它由一系列自动程序组成,可以从一组示例数据推演出基本规则,即通过示例数据来“习得”规则。通过应用预定义和可理解的算法和规则,或者使用人工神经网络(如深度学习)就可以实现此技术。机器学习技术可细分为“监督式学习”和“非监督式学习”。在监督式学习中,学习的样本数据同时包含输入数据和相应的预期结果(例如分类),而在非监督式学习中,应该由系统来自行确定输入数据可能产生的结果。

(三)深度学习

深度学习是一种机器学习方法,它作为人工神经网络可以根据学习过程中的示例数据来独立地构建(训练)出基本规则。尤其是在机器视觉领域,神经网络通常采用监督式学习的方法来训练,即通过示例数据和示例数据的预定义结果来进行训练。

二、深度学习的发展历程

(一)Turing Testing

图灵测试是人工智能是否真正能够成功的一个标准,“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房间中,房间外的一个人同时询问人和计算机相同的问题,如果房间外的人无法分别哪个是人,哪个是计算机,就能够说明计算机具有人工智能。

(二)医学上的发现

1981年的诺贝尔将颁发给了David Hubel和Torsten Wiesel,以及Roger Sperry。他们发现了人的视觉系统处理信息是分级的

从视网膜(Retina)出发,经过低级的V1区提取边缘特征,到V2区的基本形状或目标的局部,再到高层的整个目标(如判定为一张人脸),以及到更高层的PFC(前额叶皮层)进行分类判断等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表达越来越抽象和概念化,也即越来越能表现语义或者意图

边缘特征 —–> 基本形状和目标的局部特征——>整个目标 这个过程其实和我们的常识是相吻合的,因为复杂的图形,往往就是由一些基本结构组合而成的。同时我们还可以看出:大脑是一个深度架构,认知过程也是深度的。

 人脑神经元示意图

计算机识别图像的过程

(三)Deep Learning的出现

深度学习,恰恰就是通过组合低层特征形成更加抽象的高层特征(或属性类别)。例如,在计算机视觉领域,深度学习算法从原始图像去学习得到一个低层次表达,例如边缘检测器、小波滤波器等,然后在这些低层次表达的基础上,通过线性或者非线性组合,来获得一个高层次的表达。此外,不仅图像存在这个规律,声音也是类似的。比如,研究人员从某个声音库中通过算法自动发现了20种基本的声音结构,其余的声音都可以由这20种基本结构来合成!

三、深度学习的工作原理

(一)人工神经网络

深度学习使用了某种形式的人工神经网络(ANN)技术,因此必须先用示例数据进行训练。经过训练的ANN就可以用来执行相关任务。使用已经过训练的ANN的过程被称为“推理”。在推理时,ANN会根据习得的规则对所提供的数据进行评估。例如,可以评估输入的图像中的物体是否存在缺陷。

 (二)神经元、层和连接

ANN由多个互相连接的“神经元”层组成。以最简单的情况为例,这些层具体是指输入层和输出层。可以将众多的神经元和连接看作一个矩阵。连接矩阵中包含输入矩阵的每个值,并连接到结果矩阵的值。连接矩阵的值包含了相应连接的权重。借助逻辑矩阵值以及输入值权重,可以在结果矩阵中生成相应的值。

 (三)深度人工神经网络

“深度学习”指的是对深度ANN进行的训练。除了输入层和输出层外,在深度ANN的可见层之间还存在成百上千个用于输入和输出的“隐藏层”。每个隐藏层的结果矩阵即是下一层的输入矩阵。因此,只由最后一层的输出矩阵来提供结果。

(四)训练

训练ANN时,最初的焦点是随机设置的,然后逐步添加示例数据。要根据输入数据和预期结果并使用训练规则来调整关系权重。ANN的最终表现(即结果评估的精度)在很大程度上取决于训练时所用的示例数据。如果用于训练的内容有大量可变性高的示例数据,则通常能产生更精确的推理结果。如果使用大量非常相似或重复的数据进行训练,那么在遇到与示例数据不同的数据时,ANN就会无法对字段进行估算。这种情况叫做ANN的过拟合(Overfitting)。

四、深度学习可以做到哪些功能?

(一)图像分类

在图像分类应用中要将图像分配为不同的类别,例如区分有缺陷的组件与无缺陷组件,并根据不同类型的缺陷对图像进行排序,或者可用于将度假照片分配到不同的类别。在曲奇饼干的生产中,图像分类技术将检查所有饼干是否完好无损。

 (二)图像分割和物体识别

图像分割可以将图像的每个像素分配给某个类别。这样就能识别出图像上的多个不同物体,例如可以识别购物篮中的不同水果,或识别交通系统中的路标、道路和的人员。此外,我们借助图像分割技术还能查看生产线上形状各异的曲奇饼干——圆形、方形或六边形。

 (三)图像处理

深度学习技术还可用于处理和优化图像数据,例如,它能消除图像的干扰噪声或补偿光学透镜造成的干扰。

 

五、为什么需要深度学习?

如果有更多的数据,那么最好的选择就是使用性能更好的深度网络来处理。很多时候,使用的数据越多,结果就越准确。经典的ML方法需要一组复杂的ML算法,而更多的数据只会影响其精度,需要使用复杂的方法来弥补较低准确性的缺陷。此外,学习也受到影响——当添加更多的训练数据来训练模型时,学习几乎在某个时间点停止。所示的图形描述了深度学习算法与传统的机器学习算法的性能差异。

深度学习算法与经典的机器学习算法的性能比较

本文转载于公众号:BFT机器人

更多资讯请关注该公众号

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值