股票操作之强化学习基础（一）

最新推荐文章于 2024-03-22 09:57:03 发布

wbbhcb

最新推荐文章于 2024-03-22 09:57:03 发布

阅读量6.7k

点赞数 1

分类专栏：量化杂文文章标签：机器学习 python 强化学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31611005/article/details/104193022

版权

首先为什么要学习强化学习？之前我一直在研究如何利用机器学习去选股，但选股只是股票操作的第一步。股票买入后往往会有加仓、减仓等操作。之前的选股策略并没有对这些操作进行研究。传统的机器学习方法（SVM、GBDT、LR等）一般适用于分类或回归问题，如果要让传统机器学习模型自动学会加仓、减仓等操作，我个人认为比较难，这其中的建模过程比较复杂。以个人目前的浅薄理解来说，这可能可以建模出来，但其效果不一定好。而强化学习就能很好的胜任股票的加仓、减仓等操作。当然强化学习也可以适用股票选择，在未来的研究中，为了将问题简单化，我们把选股的工作交给传统机器学习模型（这里我们之前用的是树模型LGB模型），个股的操作我们交给强化学习。

然后强化学习是干什么的，有什么作用？一般来说机器学习问题可以分为有监督学习（样本有标签）、无监督学习（样本无标签，如聚类就是无监督学习）以及强化学习。强化学习也是机器学习中的一个重要分支，其本质是解决decision making问题，即自动进行决策。目前很多领域都有强化学习的出色表现，比如在围棋上Alohago战胜了柯洁和李世石，又比如在很多MOBA游戏上（如英雄联盟）AI也战胜了很多职业玩家。

接下来我这里简单描述下强化学习。强化学习主要包含四个元素：agent、environment（环境状态）、action（行动）、reward（奖励）, 强化学习的目标就是获得最多的累计奖励。

这里引用一篇博客中的例子 [1]。我们以小孩学习走路来做个形象的例子：小孩想要走路，但在这之前，他需要先站起来，站起来之后还要保持平衡，接下来还要先迈出一条腿。应该迈是左腿

最低0.47元/天解锁文章

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
股票操作之强化学习基础（一）

首先为什么要学习强化学习？之前我一直在研究如何利用机器学习去选股，但选股只是股票操作的第一步。股票买入后往往会有加仓、减仓等操作。之前的选股策略并没有对这些操作进行研究。传统的机器学习方法（SVM、GBDT、LR等）一般适用于分类或回归问题，如果要让传统机器学习模型自动学会加仓、减仓等操作，我个人认为比较难，这其中的建模过程比较复杂。以个人目前的浅薄理解来说，这可能可以建模出来，但其效果不一定好。...
复制链接

扫一扫

专栏目录

wbbhcb CSDN认证博客专家 CSDN认证企业博客

码龄9年

40: 原创

4万+: 周排名

46万+: 总排名

17万+: 访问

: 等级

2094: 积分

299: 粉丝

83: 获赞

15: 评论

814: 收藏

私信

关注

热门文章

分类专栏

量化杂文 36篇
数据挖掘竞赛 1篇

最新评论

利用机器学习搭建选股策略并进行荐股的完整代码
a1024801337: 请问github上的python是哪个版本
量化建模时常见的数据穿越问题
weixin_39065106: 我理解博主说的用LGBM的特征重要性判断特征是否穿越是一种以结果推断过程的方式，所以不仅仅LGBM，XGB的特征重要性也是同样的道理，用特征KS、IV异常高来判断亦可。
量化建模时常见的数据穿越问题
文艺女程序员: 请问xgb的feature_importance能查验出来特征穿越吗
利用强化学习进行股票操作实战（四）
☞小白: 博主，pycharm运行完之后，测试结果部分的曲线图，是怎么画的啊
利用强化学习进行股票操作实战（三）
☞小白: 博主，pycharm运行完之后，测试结果部分的曲线图，是怎么画的啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。