文章目录
金融
- 股票市场具有变化快、干扰因素多、周期数据不足等特点,股票交易是一种不完全信息下的博弈过程,单目标的监督学习模型很难处理这类序列化决策问题。
智能股市操盘手ISTG
- 融合历史行情数据、技术指标、宏观经济指标等多数据类型,分析评判标准和优秀控制策略,加工长周期数据,实现可增量扩展不同类型数据的复盘模型,自动计算回报标签,训练智能操盘手,并提出直接利用行情数据计算单步确定性动作值的方法。
- 目标建立高收益、低风险的目标,辅助判断市场形势、投资决策、预测股市未来的发展。
- DRL实现了类生物智能体,不受体力和情绪限制,能通过网络获得几乎无限的存储和计算能力,并结合了深度学习的高维数据感知能力、数据统计分析的预测能力、强化学习的搜索最优操作策略能力,使得智能体能快速成为某个领域的强手。
模型建立
- 目标是在某个市场中,根据历史(多日)行情,进行当日的买卖操作,找到最优的行动策略&#x