第二节:基础篇认识强化学习

7 篇文章 0 订阅 ¥299.90 ¥399.90
本文介绍了将强化学习应用于股票买卖的入门知识,重点在于理解强化学习的核心结构及其在股票交易中的应用。内容涵盖了强化学习的基本概念,如agent、环境、State、REWARD、POLICY和ACTION,并通过代码示例展示了如何建立股票交易的强化学习模型。最终目标是通过学习和优化策略,使炒家在股票交易中实现盈利最大化。
摘要由CSDN通过智能技术生成

本专栏是强化学习运用在买卖股票之上的入门学习内容。
主要解决强化学习代码落地和代码实践,不需要学习相关数学原理,直观简单的带领读者入门强化学习炒股。
查看本专栏完整内容,请访问:https://blog.csdn.net/windanchaos/category_12391143.html
本文发布地址:https://blog.csdn.net/windanchaos/article/details/132000000

本文内容需掌握和理解。

认识强化学习

理论概述

强化学习是什么,网上很多相关资料,如果没有学过建议去大概看看。
能搜到本专栏的人,大多是认可了炒股用强化学习可能是最适合的这一假说,所以本文只对强化学习核心结构做描述,如果你已经学过可大概看看甚至可以跳过本节。

我们始终站在输入-输出的模型来看问题,这样更简化对复杂问题的理解。

强化学习,是输入-输出模型的细化,输出将作为输入的判定依据,影响输入,而输入也会影响输出。这是一个输入-输出相互反馈的系统。

最笼统的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

windanchaos

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值