标星★公众号,第一时间获取最新资讯
本期作者: Alexey Burnakov
本期翻译:1+1=6
近期原创文章:
♥ 2018中国量化投资年度盘点【独家】
♥ 利用深度学习最新前沿预测股价走势
♥ 一位数据科学PhD眼中的算法交易
♥ 深度学习是信号处理和时序分析的最后选择?
♥ 人工智能『AI』应用算法交易,7个必踩的坑!
♥ 神经网络在算法交易上的应用系列(一)
♥ 预测股市 | 如何避免p-Hacking,为什么你要看涨?
♥ 如何鉴别那些用深度学习预测股价的花哨模型?
♥ Quant必备:学什么、哪家面试难、哪家挣大钱?
全部代码,文末下载
首先请阅读这篇文章:
地址:https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf
它将向您介绍使用深度Q-Network (DQN)来逼近对解决马尔可夫决策过程至关重要的值函数的思想。
还推荐使用Richard S. Sutton and Andrew G. Barto: 的这本书的预印本深入研究RL数学:
地址:
http://incompleteideas.net/book/bookdraft2017nov5.pdf
稍后将介绍原始DQN的一个高级版本,它包含了更多的想法,以帮助它更好更快地收敛,即:
Deep Double Dueling Noisy神经网络与 prioritized sampling的经验回放缓冲区。
是什么使这种方法优于传统的DQN?
Double: there are two networks which train and estimate next Q values
Dueling: there are neurons