qlearning算法_优化强化学习Qlearning算法进行股市交易(附代码)

标星★公众号,第一时间获取最新资讯本期作者:Alexey Burnakov本期翻译:1+1=6近期原创文章:♥2018中国量化投资年度盘点【独家】♥利用深度学习最新前沿预测股价走势♥一位数据科学PhD眼中的算法交易♥深度学习是信号处理和时序分析的最后选择?♥人工智能『AI』应用算法交易,7个必踩的坑!♥神经网络在算法交易上的应用系列(一)♥预测股市 | 如何避免p-Hac...
摘要由CSDN通过智能技术生成

18a4a55f002ee319401021801c9b8424.png标星★公众号,第一时间获取最新资讯

本期作者: Alexey Burnakov

本期翻译:1+1=6

近期原创文章:

♥ 2018中国量化投资年度盘点【独家】

 利用深度学习最新前沿预测股价走势

 一位数据科学PhD眼中的算法交易

 深度学习是信号处理和时序分析的最后选择?

 人工智能『AI』应用算法交易,7个必踩的坑!

 神经网络在算法交易上的应用系列(一)

 预测股市 | 如何避免p-Hacking,为什么你要看涨?

 如何鉴别那些用深度学习预测股价的花哨模型?

 Quant必备:学什么、哪家面试难、哪家挣大钱?

全部代码,文末下载

首先请阅读这篇文章:

地址:https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf

9250f12261429b84689bf9b41b6e58f0.png

它将向您介绍使用深度Q-Network (DQN)来逼近对解决马尔可夫决策过程至关重要的值函数的思想。

还推荐使用Richard S. Sutton and Andrew G. Barto: 的这本书的预印本深入研究RL数学:

地址:

http://incompleteideas.net/book/bookdraft2017nov5.pdf

745f3d68245c9da44bda6251ef109b7b.png

稍后将介绍原始DQN的一个高级版本,它包含了更多的想法,以帮助它更好更快地收敛,即:

Deep Double Dueling Noisy神经网络与 prioritized sampling的经验回放缓冲区。

是什么使这种方法优于传统的DQN?

  • Double: there are two networks which train and estimate next Q values

  • Dueling: there are neurons

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值