强化学习
文章平均质量分 70
强化学习+金融
sumilkk
无所适从
展开
-
【强化学习】策略梯度算法中的损失函数
策略梯度算法的推导,策略梯度算法的实现,策略梯度算法的损失函数的理解。原创 2022-09-09 14:23:59 · 4891 阅读 · 0 评论 -
【强化学习】spinningup最简单的策略梯度(VPG)代码详细注释——基于pytorch实现
参考链接:https://spinningup.qiwihui.com/zh_CN/latest/spinningup/rl_intro3.html。需要配合spinningup的公式推导。原创 2022-09-08 12:22:43 · 1181 阅读 · 1 评论 -
零基础创建自定义gym环境——以股票市场为例
零基础创建自定义gym环境——以股票市场为例翻译自Create custom gym environments from scratch — A stock market examplegithub代码注:本人认为这篇文章具有较大的参考价值,尤其是其中的代码,文章构建了一个简单的量化交易环境。对于强化学习方法的使用,直接调用了stable-baselines,略去了算法实现的细节,对于初学者很是友好。另外,其构建环境继承自gym.Env也具有很大的学习意义。OpenAI的gym是一个非常优秀的包,能原创 2022-03-11 13:52:55 · 4688 阅读 · 5 评论