请大家关注我,本文章粉丝可见,我会一直更新下去,完整代码进QQ群获取:323140750,大家一起进步、学习。
8.4.6 准备训练模型环境
创建训练模型的环境,并初始化了一些环境参数,具体实现代码如下所示。请注意,这个环境是用于训练强化学习模型的,它将模拟股票交易并生成奖励信号,供模型学习。
env_kwargs = { "stock_dim": stock_dimension, "hmax": 1000, "initial_amount": 1000000, "buy_cost_pct": 6.87e-5, "sell_cost_pct": 1.0687e-3, "reward_scaling": 1e-4, "state_space": state_space, "a