1、这个 IbEnv 模仿 OpenAIGym 把金融历史数据 编写成 类似游戏的模块
2、基本概念 强化学习中 需要定义 (1)观察空间 class observation_space()
(2)动作空间 class action_space()
3、IbEnv 工作过程(1)初始化 获取并处理ohlc数据(2)reset()初始化环境
(3)step(action)给环境一个动作,返回下一个状态state
4、结果展示
阶段总结 接下来计划
10.25 解决了盈透api问题
10.26 finance类的编写 完成了 IbEnv 用于learn train model 类的编写
10.27 计划 完成 IbRebot 的编写 训练机器人 保存agent model
10.28 计划 完成 Ib_trading_Env 实盘数据流的编写 接入agent