量化交易
文章平均质量分 92
淡然之枫
这个作者很懒,什么都没留下…
展开
-
状态空间MCMC论文笔记
论文一:模拟案例yt=nt∗ctnt=a+nt−1+wtct=a1ct−1+a2ct−2+vty_t = n_t*c_t\\n_t =a+n_{_{t-1}} + w_{_t}\\ c_t=a_{_1}c_{_{t-1}}+a_2c_{_{t-2}}+v_t\\yt=nt∗ctnt=a+nt−1+wtct=a1ct−1+a2ct−2+vt理论推导(一)整体思想令y⃗T=[y1,y2,...,yn]′\vec{y}_{_T}=[y_1,y_2,...,y_n]原创 2020-09-23 16:46:55 · 640 阅读 · 0 评论 -
Agent Inspired Trading Using Recurrent Reinforcement Learning and LSTM Neural Networks论文解析
为什么要翻译这篇文章 本人利用DNN和RNN做了深度强化学习的策略,本质上是一个基于策略梯度的强化学习,翻看这个作者的论文发现,核心思路是一模一样的,差别在于细节的处理,先说说和作者的相似之处:用神经网络来表示一个确定性策略;状态空间是一个连续的,从神经网络的角度来讲,就是所谓的特征。这样做必须要解决的问题就是把状态到动作的映射变成一个连续可导的函数,由于在交易中,我们有最小交易单位,比如一手,你总不能交易1.5手把,所以,我们的动作往往是离散的,需要用技术手段,将其连续化,这就是与作者第二个相原创 2020-05-29 15:08:51 · 948 阅读 · 0 评论