（8-4-3）股票交易策略实战：制作股票交易策略模型

最新推荐文章于 2024-03-16 19:56:18 发布

码农三叔

最新推荐文章于 2024-03-16 19:56:18 发布

阅读量1.2k

点赞数 26

分类专栏：金融大模型文章标签：人工智能大数据算法机器学习 python

本文链接：https://blog.csdn.net/asd343442/article/details/135305573

版权

金融大模型专栏收录该内容

127 篇文章 2 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

请大家关注我，本文章粉丝可见，我会一直更新下去,完整代码进QQ群获取：323140750，大家一起进步、学习。

8.4.8 训练A2C模型

A2C（Advantage Actor-Critic）是一种深度强化学习算法，它结合了演员-评论家（Actor-Critic）方法和优势函数（Advantage Function）的概念，用于解决连续动作空间的强化学习问题。A2C是一种策略梯度方法，旨在训练一个模型来学习在与环境的交互中获得最大奖励的策略。请看下面的代码，功能是使用FinRL库中的类DRLAgent训练一个A2C（Advantage Actor-Critic）强化学习模型。

agent = DRLAgent(env=env_train)
model_a2c = agent.get_model("a2c")
trained_a2c = agent.train_model(model=model_a2c, tb_log_name='a2c', total_timesteps=50000)

对上述代码

了解本专栏

超级会员免费看

码农三叔

关注

26
点赞
踩
25

收藏

觉得还不错? 一键收藏
打赏
0
评论
（8-4-3）股票交易策略实战：制作股票交易策略模型

daily_return_base = plotter.get_return(baseline_df, value_col_name="close")：计算基准策略的每日收益率，基准策略的数据来自基准策略的DataFrame baseline_df，并且使用了 "close" 列作为收益率的计算依据。总之，上述代码用于配置和创建一个用于测试交易策略的股票交易环境，然后将训练好的DDPG模型应用于测试环境中，模拟了在真实市场上执行交易策略的过程，并记录了投资组合价值和交易决策，以便后续的回测和性能评估。
复制链接

扫一扫