彻底看懂RNN,LSTM,GRU,用数学原理解释梯度消失或者梯度爆炸

Recurrent Neutral Network

章节

RNN概述

为什么它叫做递归神经网络呢?与其他网络有何不同?接下来用简单例子阐述:

这是比较简单的示意图,比如说一个网络只有一层,那么,那一层代表的函数方法就是这个网络实际对输入所起的作用,即Y = Funtion(X),我们实际上想找出那个function它究竟是什么。

在这里插入图片描述

可以从下图看出,RNN得到一个输出不仅仅靠输入的X,同时还依赖于h,h在RNN中被叫做cell state,那么h如何得出呢?由公式(1)可知,h_t是由h_(t-1)经过某种函数变换得到的,换句话说,我要得到目前这一个的,我还必须经过前一个才能做到。这里我们可以类比一下斐波那契数列,f(t) = f(t-1) + f(t-2),某一项需要由前两项一起才能完成,RNN是某一个h需要前面一个h来完成,这也是为什么被叫做递归神经网络。顺带一提,这里的function有权重参数,即为W,而这个W是共享的,意思是无论是h_1到h2还是h_2到h_3,它们用的function其实是一样的。
在这里插入图片描述

在这里插入图片描述

所以,复杂一点的RNN长这样:

在这里插入图片描述

每次输出完一个y,它同时还会有一个h出来,作为下一层的参数一起使用。从这一点来看,RNN跟其他网络不同的一点是前一层的输出同时可以作为后一层的输入,经过一层就会更新一次h,那么,h究竟是如何更新的呢?tanh是一种常用的激活函数,可见Activation

在这里插入图片描述

y_t可以由此得出:

在这里插入图片描述

从上述公式中可以看出有不同的W,即不同的权重矩阵,这些矩阵是机器自己去从数据中去学出来,同时也可以是人为设置的。注意,这些不同类之间的矩阵不同,但是如果说是同一个function,那么权重矩阵都是共享的。

传统的DNN,CNN的输入和输出都是固定的向量,而RNN与这些网络的最大不同点是它的输入和输出都是不定长的,具体因不同任务而定。

在这里插入图片描述


LSTM

  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 关系分类可以使用多种模型,包括但不限于:卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)、注意力机制(Attention)、BERT等。这些模型都有各自的优缺点,需要根据具体情况选择合适的模型。 ### 回答2: 关系分类主要是通过对输入样本进行特征提取和分类器训练来实现的。常见的关系分类模型包括以下几种: 1. 传统机器学习模型:包括朴素贝叶斯分类器、支持向量机、逻辑回归等。这些模型一般基于统计学原理数学模型构建,具有较好的解释性和可解释性,适用于中小规模的数据集。 2. 深度学习模型:包括卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)等。深度学习模型具有强大的拟合能力和特征学习能力,能够自动提取特征并进行分类,适用于大规模数据集和复杂的关系分类任务。 3. 图神经网络(Graph Neural Network,GNN):这是一种专门用于处理图数据的模型,能够有效地建模和捕捉实体之间的关系。GNN可以对图结构进行嵌入表示学习,并通过图卷积等操作实现关系分类。 4. 集成学习模型:如随机森林、Boosting等。集成学习模型通过结合多个基分类器的结果来提高分类性能,能够减少模型的过拟合和提高模型的泛化能力,适用于特征维度较高和噪声较多的关系分类任务。 5. 迁移学习模型:通过利用已有任务训练得到的模型参数,在新的关系分类任务上进行微调或迁移学习。迁移学习可以通过共享底层特征提取层,减少对大量数据的依赖,缩短模型训练时间,并能够在数据不足的情况下仍能表现出较好的性能。 综上所述,关系分类可以使用传统机器学习模型、深度学习模型、图神经网络、集成学习模型和迁移学习模型等多种模型进行建模和分类。根据具体任务的数据规模、复杂程度和性能要求,可以选取相应的模型来解决问题。 ### 回答3: 关系分类是指在自然语言处理(NLP)领域中,对文本中的关系进行分类的任务。关系分类可以使用多种模型来实现,下面是几种常见的模型: 1. 逻辑回归模型:逻辑回归是一种经典的二分类模型,可以用于关系分类任务。它可以通过学习训练数据中的特征和标签之间的关系,然后对未知数据进行分类。 2. 支持向量机(SVM)模型:SVM是一种常用的分类模型,可以通过构建一个超平面将两个不同类别的数据分开。对于关系分类任务,可以使用SVM模型来学习关系之间的边界,从而进行分类。 3. 随机森林模型:随机森林是一种集成学习方法,可以通过组合多个决策树来进行分类。对于关系分类,可以构建多个决策树来学习特征和标签之间的关系,并通过投票的方式进行最终的分类。 4. 深度学习模型:近年来,深度学习在NLP领域中取得了重大突破。对于关系分类,可以使用深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)等来学习文本表达和关系之间的特征,进而进行分类。 5. 贝叶斯网络模型:贝叶斯网络是一种概率图模型,可以通过表示变量之间的条件依赖来进行分类。在关系分类任务中,可以使用贝叶斯网络来表示特征和标签之间的依赖关系,并进行概率推理来进行分类。 以上是关系分类任务中常用的几种模型,根据具体任务和数据的特点,选择合适的模型可以提高分类效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值