深度学习基础知识介绍

最新推荐文章于 2024-09-13 10:27:31 发布

守望者白狼

最新推荐文章于 2024-09-13 10:27:31 发布

阅读量271

点赞数 1

分类专栏：深度学习文章标签：深度学习

深度学习专栏收录该内容

15 篇文章 2 订阅

订阅专栏

1.1 MLP网络

MLP网络是一种应用最为广泛的一种网络，其中DNN就是属于MLP网络，它是一个前向结构的人工神经网络，输入一组向量向前传播输出向量，网络结构如下：
在这里插入图片描述
各个层级关系：
其中σ表示激活函数，集中常见的激活函数有：sigmod函数，tanh函数，ReLU函数。
sigmod函数：
tanh函数：
ReLU函数：

1.2 RNN网络

RNN是一种节点定向连接成环的人工神经网络，与DNN网络相比，RNN可以利用上一个时序的输出及当前输入计算输出，网络结构如下：
在这里插入图片描述
展开如下：
各层关系：

1.3CNN网络

卷积神经网络，是一种前馈神经网络，通过卷积操作可以对一个连续区域进行识别，在图像处理取得不错效果。卷积神经网络的结构有原始图像输入层、卷积层、池化层、全连接层、输出层。网络结构如下：
在这里插入图片描述
各个层之间的连接关系如下：
输入层X与卷积层C的关系:

卷积层C与采样层S的关系:

采样层S与输出层Y的关系:

其中K={km,n}表示一个卷积核。

1.4 AE网络

AE自编码器，属于无监督网络。自编码器的目的是输入X与输出X’尽可能接近，网络结构为两层的MLP，这种接近程度通过重构误差表示，误差的函数有均方差和交叉熵，为了保证网络的稀疏性误差函数加L1正则项，为了保证网络的鲁棒性输入增加随机噪声数据。网络结构如下：
在这里插入图片描述
1.5 RBM网络

Restricted Boltzmann Machine（受限波尔兹曼机）RBM是无监督的网络。具有两层结构、对称连接且无自反馈的随机神经网络模型，层间全连接，层内无连接。RBM是一种有效的特征提取方法，用于初始化前馈神经网络可明显提高泛化能力，堆叠多个RBM组成的深度信念网络（DBN）能提取更抽象的特征。网络结构如下：
在这里插入图片描述
RBM网络参数的训练原理较为复杂，简单来讲就是求网络的能量函数最小时对应的参数。

1.6深度学习与传统模型融合

深度学习与传统模型融合，例如：利用wide&deep就是MLP结合LR的模型，根据模型的训练方式融合模型可以分为松耦合模型和紧耦合模型。

松耦合模型：模型的不同部分是独自训练，例如FNN模型就是预先训练好embedding层参数，然后在训练MLP参数。

紧耦合模型：模型的不同部分是一起训练的，这类模型也可以称为end-to-end模型，例如wide&deep就是LR模型的参数和MLP的参数是一起训练的。

两种方式各有利弊，松耦合模型的优势是可以灵活组装，紧耦合模型的优势是通过联合在一起训练得到整体效果最优的参数。

1.7深度学习常见的损失函数

常用的损失损失函数有两种：交叉熵损失函数、均方差损失函数

（1）交叉熵损失函数：
在这里插入图片描述
（2）均方差损失函数：

1.8梯度下降法

在机器学习的许多算法的模型求解过程中，都是通过构造损失函数，然后求解损失函数最小时对应的参数作为模型的解。梯度函数的求解过程如下：
第1步：把模型所有参数统一记到一个集合，不妨记为在这里插入图片描述，随机给定一组在0-1之间，设为，初始化迭代步数 k=0。
第2步：迭代计算其中用于控制收敛速度，取0.01。
第3步，判断是否收敛，如果满足下列两个条件之一则返回，两个条件分别为：
条件1：，其中iteNums是最大迭代次数。