Review of deep learning: concepts, CNN architectures, challenges, applications, future directions(二)

Alzubaidi L, Zhang J, Humaidi A J, et al. Review of deep learning: concepts, CNN architectures, challenges, applications, future directions[J]. Journal of big Data, 2021, 8: 1-74.

引用量:4496

五、Classifcation of DL approaches

DL技术可分为三大类:无监督、部分监督(半监督)和有监督。此外,深度强化学习(DRL),也被称为RL,是另一种类型的学习技术,它通常被认为属于部分有监督的(偶尔也是无监督的)学习技术的类别。

1、Deep supervised learning

该技术处理标记数据。当考虑这种技术时,环境有一个输入和合成输出的集合\left ( x_{t} ,y_{t}\right )\sim \rho。例如,如果智能代理根据输入x_{t}猜测\hat{y}_{t}=f\left (x_{t}\right ),并将l\left (\hat{y}_{t},y_{t} \right )作为损失值获得。接下来,由代理反复更新网络参数,以获得对优选输出的改进估计。在积极的训练结果之后,代理获得从环境获得正确解决方案的能力。对于DL,有几种有监督的学习技术,如循环神经网络(RNNs)、卷积神经网络(CNNs)和深度神经网络(DNNs)。此外,RNN类别还包括门控复发单位(GRUs)和长期短期记忆(LSTM)方法。这种技术的主要优点是能够收集数据或从先验知识中生成数据输出。然而,这种技术的缺点是,当训练集不拥有应该在类中的样本时,决策边界可能会过度紧张。总的来说,这种技术在高性能学习方面比其他技术更简单。

2、Deep semi‑supervised learning

在这种技术中,学习过程是基于半标记的数据集。生成式对抗网络(GANs)和DRL的使用方式偶尔与这种技术相同。此外,包括GRUsLSTM在内的RNNs也被用于半监督学习。这种技术的优点之一是可以最小化所需的标记数据量。另一方面,该技术的缺点之一是不相关的输入特征,呈现的训练数据可能提供不正确的决策。文本文档分类器是半监督学习的应用程序中最流行的例子之一。由于具有获得大量标记文本文档的缺陷,半监督学习是文本文档分类任务的理想选择。

3、Deep unsupervised learning

这种技术使得在没有可用的标记数据(即不需要标签)的情况下实现学习过程成为可能。在这里,代理学习了发现输入数据中未被识别的结构或关系所需的重要特征或内部表示。生成网络技术、降维技术和聚类技术经常被计算在无监督学习的范畴内。DL家族的几个成员在非线性降维和聚类任务上表现良好;这些包括受限的玻尔兹曼机器,自动编码器和通用神经网络作为最新开发的技术。此外,包括GRUs和LSTM方法在内的RNNs也被广泛地应用于无监督学习。无监督学习的主要缺点是无法提供有关数据排序的准确信息,而且计算上很复杂。最流行的无监督学习方法之一是聚类[54]

4、Deep reinforcement learning

强化学习作用于与环境的交互,而监督学习作用于所提供的样本数据。该技术是在2013年由谷歌Deep Mind [55]开发出来的。随后,许多依赖于强化学习的增强技术被构建出来。例如,如果输入环境采样: x_{t} \sim \rho,代理预测\hat{y}_{t}=x\left (f_{t}\right )并且代理的接收成本为c_{t} \sim P(c_{t}\mid x_{t},\hat{y}_{t}),P是未知的概率分布,然后环境向代理提出一个问题,它给出的答案是一个嘈杂的分数。这种方法有时也被称为半监督学习。基于这一概念,开发了几种有监督和无监督的技术。与传统的监督技术相比,执行这种学习是更加神秘的,因为在强化学习技术中没有直接的损失函数可用。此外,监督学习和强化学习之间有两个基本的差异: 首先,没有完全访问功能,这意味着需要通过交互查询;第二,交互的状态建立在一个环境上,输入x_{t}基于前面的动作[9,56]

为了解决一个任务,需要执行的强化学习类型的选择是基于问题的空间或范围。例如,DRL是优化涉及许多参数的问题的最佳方法。相比之下,无导数强化学习是一种在有限参数的问题下表现良好的技术。强化学习的一些应用是商业战略规划和工业自动化中的机器人技术。强化学习的主要缺点是,参数可能会注入学习的速度。以下是利用强化学习的主要动机:

•它可以帮助你确定哪些行动能在更长的时间内产生最高的奖励。

•它可以帮助您发现哪种情况需要采取行动。

•它还使它能够找出获得大额奖励的最佳方法。

•强化学习也给了学习代理一个奖励函数。

强化学习不能在所有的情况下都加以利用,例如:

•如果有足够的数据来解决监督学习技术的问题。

•强化学习是计算和耗时的,特别是当工作空间很大时。

六、Types of DL networks

本节将讨论最著名的深度学习网络类型:它们包括递归神经网络(RvNNs)、RNNs和cnn。本节对rvnn和rnn进行了简短的解释,而cnn则由于这种类型的重要性进行了深入的解释。此外,它在其他网络中的多个应用中使用最多。

1、Recursive neural networks

RvNN可以在层次结构中实现预测,也可以利用组合向量[57]对输出进行分类。递归自联想记忆(RAAM)[58]是RvNN发展的主要灵感来源。RvNN架构是为处理对象而生成的,这些对象具有随机形状的结构,如图形或树。这种方法从一个可变大小的递归数据结构中生成一个传真宽的分布式表示。利用引入的通过结构的反向传播(BTS)学习系统[58]对网络进行训练。BTS系统跟踪与一般反向传播算法相同的技术,并能够支持树状结构。自动关联训练网络在输出层上重新生成输入层模式。RvNN在NLP环境中是非常有效的。Socher等人[59]介绍了RvNN体系结构,设计用于处理来自各种模式的输入。这些作者展示了对自然语言句子进行分类的两个应用:每个句子被分成单词和自然图像的情况,以及每个图像被分割成感兴趣的不同部分的情况。RvNN计算一对可能的分数来合并并构造一个语法树。此外,RvNN为每一对单位计算一个与合并合理性相关的分数。接下来,将得分最大的成对合并到一个合成向量中。每次合并后,RvNN生成

(a)一个更大的大量单元

(b)一个区域的组成向量

(c)一个类的标签(例如,如果两个单位是名词单词,一个名词短语将成为新区域的类标签)。

  • 7
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值