序列预测
文章平均质量分 96
陈小虾
机器学习、神经网络、数据结构、软件开发、产品、C++、Python
展开
-
循环神经网络RNN详细推导
本文详细推介绍RNN的发展历史,工作原理,以及前向和后向传播算法,并给出了详细的推导过程,最后简单介绍了梯度消失和梯度爆炸。原创 2019-07-14 15:15:49 · 2920 阅读 · 1 评论 -
LSTM(长短时间记忆模型)的详细推导
由于RNN梯度消失而不能处理长序列的问题,提出了LSTM,本文对从RNN到LSTM的改进思想、LSTM的模块、前向传播和反向传播进行了推导。原创 2019-07-20 08:45:40 · 6673 阅读 · 0 评论 -
生成对抗网络GAN详细推导
生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络最最直接的应用是数据的生成,而数据质量的好坏则是评判GAN成功与否的关键。本文介绍了GAN最初被提出时的基本思想,模型和公式推导,以及训练。原创 2019-07-21 13:35:52 · 2888 阅读 · 7 评论 -
时间序列模型的用处
什么是所有预测类问题所共同包含的特点? 模式识别。所谓模式, 是在随机和无序的现象中蕴含的规律性(用另一个词说就是信息)...转载 2019-09-26 15:15:24 · 2579 阅读 · 0 评论 -
深度学习中的注意力机制
最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,同时也抽象出其本质思想,并介绍了注意力模型在图像及语音等领域的典型应用场景。注意力模型最近几年在深度学习各个领域被广泛使用...转载 2019-09-29 09:59:25 · 382 阅读 · 0 评论