RNN

最新推荐文章于 2024-07-05 20:11:57 发布

Echo_ldy

最新推荐文章于 2024-07-05 20:11:57 发布

阅读量141

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Echo_ldy/article/details/105655219

版权

RNN结构

在这里插入图片描述
One-hot encoding: Sparse
Distributed representation: Non-sparse/compact

Vanishing/Exploding Gradient 梯度消失/爆炸

BPTT: Back propagation through time
ht（隐藏）层对之前ht-1（隐藏）层的梯度
在这里插入图片描述

Vanshing Gradient: <1
Exploding Gradient: >1

RNN比较难训练的原因，当时序的长度非常长的时候，在计算梯度的时候，会遇到梯度爆炸/消失。

不同模型的应用场景

在这里插入图片描述

GRU (Gated Recurrent Unit)

两个门，模型比LSTM简单，但是效果差不多

分词：

动态规划或递归算法

在这里插入图片描述

递归：时间复杂度高，因为中间过程没有存储，很多递归问题都可以优化成动态规划的问题。

Representation Learning 表示学习

The better representation lies in lower dimensional manifold.

判别一个好的representation：
1. Smoothness
不平滑的函数很难做优化
在这里插入图片描述
2. Multiple Expalnatory Factors (Disentangling Factors)

在这里插入图片描述
3. Hierarchical Representation
比较底层一些的特征可以进行迁移学习，例如word2vec可以看成是一个迁移学习的产物。

4. Shared Factors Across Tasks
把学好的representation 应用到不同的task上，核心还是迁移学习。
在这里插入图片描述

5. Low Dimensional Manifold

6. Temporal/Spacial Coherence
在这里插入图片描述 u1和u2的表示不要差别太大

7. Sparsity

在这里插入图片描述

越往下训练，梯度会越来越小

Ways to solve training

layer-wise pretraining
activation function
better optimisation
large data

Dropout

在深度学习网络的训练过程中，按照一定的概率将一部分神经网络单元暂时从网络中丢弃，相当于从原始的网络中找到一个更瘦的网络。
在这里插入图片描述 Dropout通过随机的选择，产生不同的model, 继而可以产生一系列集成的模型，然后取平均，可以防止过拟合。

Seq2Seq Model

分为encoder和decoder两个过程
在这里插入图片描述穷举法，列出所有的可能性
每次选取概率最大的k个词，相当于贪心算法

attention 机制

在这里插入图片描述

Self attention

在这里插入图片描述在机器学习尤其是深度学习中，softmax是个常用且比较重要的函数，尤其在多分类的场景中使用广泛。softmax把一些输入映射为0-1之间的实数，并且归一化保证和为1，因此多分类的概率之和也刚好为1。

Self attention中，除以了一个学习出来的数“8”（根号下dk），将原始的score,112和96转换成14和12，然后再用softmax函数，得到了结果0.88和0.12。（直接用的话得到的结果是1和0）

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RNN

RNN结构One-hot encoding: SparseDistributed representation: Non-sparse/compactVanishing/Exploding Gradient 梯度消失/爆炸BPTT: Back propagation through timeht（隐藏）层对之前ht-1（隐藏）层的梯度Vanshing Gradient: <...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。