股票深度强化型学习操盘手

本文探讨了股票市场中的智能股市操盘手ISTG,它利用DQN算法和深度学习处理复杂的序列决策问题,结合历史行情、技术指标等多数据类型,建立高收益低风险的投资策略。强化学习的MDP模型被用来寻找最优操作策略,同时优化总收益、动作幅度风险和操作次数风险。
摘要由CSDN通过智能技术生成

金融

  • 股票市场具有变化快、干扰因素多、周期数据不足等特点,股票交易是一种不完全信息下的博弈过程,单目标的监督学习模型很难处理这类序列化决策问题。

智能股市操盘手ISTG

  • 融合历史行情数据、技术指标、宏观经济指标等多数据类型,分析评判标准和优秀控制策略,加工长周期数据,实现可增量扩展不同类型数据的复盘模型,自动计算回报标签,训练智能操盘手,并提出直接利用行情数据计算单步确定性动作值的方法。
  • 目标建立高收益、低风险的目标,辅助判断市场形势、投资决策、预测股市未来的发展。
  • DRL实现了类生物智能体,不受体力和情绪限制,能通过网络获得几乎无限的存储和计算能力,并结合了深度学习的高维数据感知能力、数据统计分析的预测能力、强化学习的搜索最优操作策略能力,使得智能体能快速成为某个领域的强手。
  • cLoTkbyKCtI67OF

模型建立

  1. 目标是在某个市场中,根据历史(多日)行情,进行当日的买卖操作,找到最优的行动策略&#x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI拉呱

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值