2022最新版-李宏毅机器学习深度学习课程-P29 RNN-2

QwQllly

已于 2023-10-27 20:09:09 修改

阅读量766

点赞数

分类专栏：李宏毅机器学习深度学习文章标签：机器学习深度学习人工智能

于 2023-10-19 21:52:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45626133/article/details/133934781

版权

李宏毅机器学习深度学习专栏收录该内容

25 篇文章 4 订阅

订阅专栏

一、RNN网络结构

与时间有关的反向传播（每次不同）

损失函数

实验其实不容易跑，因为他的损失函数曲线幅度很大

画出来差不多是这个样子。突然一下升高是因为从右到左碰到陡峭的地方梯度一下变大了，所以弹回去了。

原作者在训练时加上了小技巧——clipping：设置一个峰值，若超过则等于该峰值。

梯度大的原因：

当W>1时，微小的变化会引起很大的变化；
当w<1时，较大的变化带来的变化也很小。

RNN一些有用的变形

LSTM以及简化为双门的GRU

Clockwise RNN && SCRN

多对一

多长对多短

这里是最后删去重复的字符

改加上null符号后，可以实现一些叠词

CTC方法

多对多（无限制）

加上一个断的符号，可以及时终止

可以用在机器学习上

语法分析

自动编码器

可以提高传输效率和节约成本

可用于文本、音频

可以通过音频做一些相似性搜索

训练过程

向量可视化

实例：Chat-bot

基于注意力的模型

增加了能够存储的能力

拥有阅读理解能力/问答能力

视觉问答

语音问答

模型架构

RNN vs Structured Learning

结合使用

与GAN做对比

以后会开一门新课，专门讲结构化学习

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。