第三节：强化学习中的套路

windanchaos

已于 2023-08-23 21:33:59 修改

阅读量225

点赞数

分类专栏：强化学习和股票文章标签：股票量化交易深度学习程序员创富机器学习

于 2023-08-23 20:44:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/windanchaos/article/details/132190515

版权

强化学习和股票专栏收录该内容

7 篇文章 0 订阅 ¥299.90 ¥399.90

订阅专栏

本专栏是强化学习运用在买卖股票之上的入门学习内容。
主要解决强化学习代码落地和代码实践，不需要学习相关数学原理，直观简单的带领读者入门强化学习炒股。
查看本专栏完整内容，请访问：https://blog.csdn.net/windanchaos/category_12391143.html
本文发布地址：https://blog.csdn.net/windanchaos/article/details/132190515

本文作为理论基础、套路和方法论，了解即可。

使用强化学习时的一般套路

了解强化学习和所使用的开发框架
如果需要，进行定量实验和超参数调整
使用单独的测试环境评估性能

首先要对强化学习有一个基本了解。这个在各类视频网站、书籍当中都有很多的资料。不是本专栏的重点。

其次，要选择使用一个强化学习的开发框架，并需要学习框架本身的基本使用。

强化学习在很多方面与其他机器学习方法不同。用于训练代理的数据是通过代理本身与环境的交互来收集的（例如，与拥有固定数据集的监督学习相比）。这种依赖性可能会导致恶性循环：如果代理收集质量差的数据（例如，没有奖励的轨迹），那么它就不会改进并继续按预期进行学习。

除其他因素外，这一因素解释了

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

windanchaos CSDN认证博客专家 CSDN认证企业博客

码龄15年

93: 原创

3万+: 周排名

16万+: 总排名

36万+: 访问

: 等级

2991: 积分

496: 粉丝

114: 获赞

40: 评论

430: 收藏

私信

关注

热门文章

分类专栏

最新评论

Backtrader官方中文文档:第八章Indicators指标
windanchaos: 没听过这个名字，这个是官方网站转译的，谁都可以。不需要就看你说的仓鼠大王，谢谢
backtrader实战：如何提高backtrader调试代码的速度
windanchaos: 安装方法已更新到文章，简单说 conda create -c conda-forge -n my_pypy pypy python=3.9，安装完切过去，开发工具选择pypy，并安装依赖。
backtrader实战：如何提高backtrader调试代码的速度
yishuihanly: 请问怎么安装pypy呢？
【计算机理论基础】计算机是如何做运算的
做而论道_CS: 还有 “浮点数”，这就更没谱了：　浮点数和计算机，仅有四个字节的关系。　这就能和《计算机组成原理》扯在一起？用 32 位二进制数，表示一批更大范围的数，　这可以说是一种：加密解密的方法。　它们之间的换算，完全是 “数学知识”。浮点数的运算步骤，有：对阶、上下溢、规格化、...，　这些破事，与《计算机组成》，毛的关系都没有啊！　更不用说与《计算机原理》的关系了。请问计算机专家，在《计算机组成原理》中写这些干嘛？　你是打算暴露，你的基本概念不清吗？
【计算机理论基础】计算机是如何做运算的
做而论道_CS: 另外，由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0001，它代表的十进制是：－128 + 64 + 32 + 1= －31。再看，另一个补码：0110 0001，它代表的十进制是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了！－－－－－－－－－－－－－－－－－－－－－－那么，所谓的：　机器数真值符号位原码反补码正数三码与正数相同　负数取反加一符号位不变符号位也参加运算模同余 ... 这一大堆乱七八糟的概念，不都是垃圾嘛！进位，是小学二年级的知识点吧？舍弃进位，很难理解吗？老外竟然能弄出那么大一堆概念！老外的数学水平，由此可见一斑。谁要是跟老外学算术，立刻、马上，就掉沟里去了！我们的计算机老师，也不懂数学，只知道跟风。一天一天的，在大学里，兜着圈子讲小学的知识。真是毁人不倦坑人不浅！这些老师，捡个鞋拔子就当成玉如意了。天天蒙骗学生，自己赚取名声和丰厚的讲课费。顺便再抓几个学生挂科，抖一下威风！现在知道我们缺芯片用的原因了吧！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

windanchaos 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。