Neural Network with Memory

目录

Vanilla Recurrent Neural Network (RNN)

RNN

Cost

Application

Variants of RNN

Long Short-term Memory (LSTM)


链接:http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2015_2/Lecture/RNN%20(v4).pdf

Vanilla Recurrent Neural Network (RNN)

RNN

在了解RNN之前,也许会有人想我都学会了之前的DNN为啥还需要再学习这玩意儿呢?我们就拿语音识别来说吧,我们把每一帧的当作DNN的输入,输出为每一帧对应的因素,但是此时帧与帧之间是相互独立,对于语音帧来说,每一帧之间是相互关联的,因此会漏掉很多信息。

考虑到上下文信息,我们使用RNN,此时每个RNN中的所有网络都是一样的;当决定y2的值时,不止要考虑x2的值,还考虑a1的值,而a1又是由x1决定的。即yi是由x1,x2,…,xi共同决定,这是DNN无法做到的。

但是RNN却难以做到的是:如果让x2不要影响y3的值,x1影响y3的值,RNN却很难做到。

 

Cost

RNN的cost function和DNN的是大同小异。但是RNN会出现一种情况,随着epoch的增加,cost逐渐下降,但是到了某一个epoch会突然增加。这种情况与bug无关,至今尚未得到解决。

 

Application

应用:句子中名词的抓取,比如让机器知道Harry是一个人,Howgwarts是一个机构,Privet是一个地方。信息提取,比如让机器能够自动地学出Boston是出发地,November 2nd是出时间,Taipei是目的地,2 p.m是到达时间。

 

Variants of RNN

Input和Output是一样的数目,在Jordan Network当中,output输出为1w维的时候,网络很容易被训坏,不过Jordan Network的效果要比Elman Network要好一些。整个网络都是由左向右训的。

Input和Output是一样的数目,整个网络都是由左向右训的。

整个网络都是由左向右和由右向左训的两部分组成。

Input的数目是多个,Output的数目是一个,我们好需要把当前的内容转化为vector。

Input的数目是多个,Output的数目是多个且比较短。对于有叠字的情况,语音识别效果会特别差,所以可以使用Connectionist Temporal Classification (CTC)。

一般用于机器翻译的场合,Input和Output的数目都是很多的,而且长度也完全不一样。一般输入可以通过“==”去判断是否终止。

Input的数目是一个,为一张图片,而Output的数目是多个,为很多的文字。

Long Short-term Memory (LSTM)

 

 

下面是一些关于循环神经网络的笔记:

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是几篇使用循环神经网络(Recurrent Neural Network,RNN)进行股票价格预测的高引用论文: 1. Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8), 1735-1780. 这篇经典论文提出了一种新的循环神经网络模型——长短时记忆网络(Long Short-Term Memory,LSTM),用于解决循环神经网络在长序列上的梯度消失问题。LSTM在很多序列预测任务上表现出色,包括股票价格预测。 2. Zhang, G. P., & Qi, M. (2005). Neural network forecasting for seasonal and trend time series. European Journal of Operational Research, 160(2), 501-514. 这篇论文探讨了使用神经网络对季节性和趋势时间序列进行预测的问题,提出了一种基于循环神经网络的新方法,并在股票价格预测中进行了实验。 3. Zhang, G. P., Patuwo, B. E., & Hu, M. Y. (1998). Forecasting with artificial neural networks: The state of the art. International Journal of Forecasting, 14(1), 35-62. 这篇综述性论文介绍了使用神经网络进行时间序列预测的研究进展,包括循环神经网络。论文讨论了神经网络在股票价格预测中的应用,并列举了多篇相关的研究论文。 4. Singh, P. K., & Kumar, S. (2018). Recurrent neural network based stock price prediction using financial news and technical indicators. Expert Systems with Applications, 107, 111-122. 这篇论文结合了股票市场的基本面和技术面因素,使用循环神经网络模型进行股票价格预测,并与传统的时间序列模型进行了比较。实验结果表明,循环神经网络模型在股票价格预测中具有更好的表现。 5. Zhang, H., Shen, H., Wang, Y., & Liu, Z. (2020). A hybrid stock price prediction model using RNN and particle swarm optimization. IEEE Access, 8, 44506-44515. 这篇论文提出了一种混合模型,将循环神经网络和粒子群优化算法相结合,用于股票价格预测。实验结果表明,该模型可以更准确地预测股票价格,并具有更强的泛化能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值