（9-4）基于深度强化学习的量化交易策略（OpenAI Baselines +FinRL+DRL+PyPortfolioOpt）：构建交易环境

码农三叔

于 2024-01-20 09:17:44 发布

阅读量1.5k

点赞数 20

分类专栏：金融大模型文章标签：人工智能深度学习机器学习 python 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/asd343442/article/details/135710980

版权

金融大模型专栏收录该内容

126 篇文章 0 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

9.7 构建交易环境

考虑到自动股票交易任务的随机性和互动性，在本项目中将金融任务建模为马尔可夫决策过程（Markov Decision Process，MDP）问题。在训练过程观察股价的变化、执行操作以及奖励计算，使代理根据奖励调整其策略。通过与环境互动，交易代理将制定随着时间推移而最大化奖励的交易策略。

本项目的交易环境基于OpenAI Gym框架实现，根据时间驱动模拟的原则模拟实时股票市场，使用真实的市场数据。

1. 训练数据拆分

（1）使用data_split函数将数据集df划分为训练集和交易集，这样的数据集划分是为了在模型训练阶段使用train集，而在模型训练后的回测或实际应用中使用trade集。

train = data_split(df, '2009-01-01','2020-07-01')
#trade = data_split(df, '2020-01-01', config.END_DATE)

了解本专栏

超级会员免费看

关注

20
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
0
评论
（9-4）基于深度强化学习的量化交易策略（OpenAI Baselines +FinRL+DRL+PyPortfolioOpt）：构建交易环境

在SB3中使用的向量化环境，主要是通过类DummyVecEnv实现。这种环境的向量化可以带来训练速度的显著提升，特别是在使用深度学习模型进行训练时，因为模型的计算可以在多个环境之间并行进行。通过使用get_sb_env()方法，原始的股票交易环境被包装成了Stable-Baselines3库中的向量化环境，以便与该库中的强化学习算法进行集成。在上述代码中，print(type(env_train))语句用于打印输出env_train的类型，以确认其为Stable-Baselines3中的环境类型。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码农三叔 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。