浅说深度学习之：序列学习

最新推荐文章于 2024-02-12 16:11:14 发布

qunnie_yi

最新推荐文章于 2024-02-12 16:11:14 发布

阅读量8.1k

点赞数 4

文章标签：深度学习人工智能机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qunnie_yi/article/details/80129301

版权

本文探讨了深度学习中的序列学习，重点讲解了循环神经网络（RNN）和长短期记忆（LSTM）单元，阐述了它们在处理序列数据如自然语言中的作用。此外，还提到了词嵌入的概念，以及编码-解码架构在机器翻译中的应用。

摘要由CSDN通过智能技术生成

本文来自：集智专栏
作者：Kaiser

系列的第一篇概览了一下深度学习中的基本概念。第二篇介绍了深度学习的历史背景，以及如何高效地训练神经网络。而这一篇当中，我们将一起认识自然语言处理领域的核心：序列学习。

图片描述

图1：长短期记忆(LSTM)单元。
LSTM有四个输入权重和四个循环权重。Peepholes是记忆细胞和门之间的额外连接，但他们对性能提升帮助不到，所以常被忽略。

序列学习

生活中的所有事物都是与时间相关的，也就形成了一个序列。为了对序列数据（文本、演讲、视频等）我们可以使用神经网络并导入整个序列，但是这样我们的数据输入尺寸是固定的，局限性就很明显。如果重要的时序特征事件恰好落在输入窗以外，就会产生更大的问题。所以我们需要的是：

能对任意长度序列做逐个元素读取的神经网络（比如视频就是一系列的图片；我们每次给神经网络一张图）；
有记忆的神经网络，能够记得若干个时间步以前的事件、这些问题和需求已经催生出多中不同的循环神经网络。

循环神经网络

若我们想让一个常规的神经网络解决两个数相加的问题，那我们只需要输入两个数字，再训练两数之和的预测即可。如果现在有3个数要相加，那么我们可以：

拓展网络架构，添加输入和权重，再重新训练；
把第一次的输出（即两数之和）和第三个数作为输入，再返回给网络。

方案(2)显然更好，因为我们希望避免重新训练整个网络（网络已经“知道”如何将两个数相加）。如果我们的任务变成：先对两数做加法，再减去两个不同的数，那这个方案又不好使了。即使我们使用额外的权重࿰

最低0.47元/天解锁文章

关注

4
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。