最近把用强化学习训练的第一版模型策略跟第二版模型策略交叉预测可买入的股票和转债,可以大大降低出现太多选择的问题。
加上根据成交量选择活跃的股票和转债,然后根据其cci指标选取合适的时机买入,基本可以做大全胜。
第一版的奖励函数仅考虑第二天是否会涨跌,第二版加入了投资资金回报的计算。有意思的是,这两版后期验证的部分模型是重合的,但不是最好的。
对转债和股票选取各自验证成功率比较高的模型,然后交叉使用,目前效果不错。
最近把用强化学习训练的第一版模型策略跟第二版模型策略交叉预测可买入的股票和转债,可以大大降低出现太多选择的问题。
加上根据成交量选择活跃的股票和转债,然后根据其cci指标选取合适的时机买入,基本可以做大全胜。
第一版的奖励函数仅考虑第二天是否会涨跌,第二版加入了投资资金回报的计算。有意思的是,这两版后期验证的部分模型是重合的,但不是最好的。
对转债和股票选取各自验证成功率比较高的模型,然后交叉使用,目前效果不错。