本专栏是强化学习运用在买卖股票之上的入门学习内容。
主要解决强化学习代码落地和代码实践,不需要学习相关数学原理,直观简单的带领读者入门强化学习炒股。
查看本专栏完整内容,请访问:https://blog.csdn.net/windanchaos/category_12391143.html
本文发布地址:https://blog.csdn.net/windanchaos/article/details/132000000
本文内容需掌握和理解。
认识强化学习
理论概述
强化学习是什么,网上很多相关资料,如果没有学过建议去大概看看。
能搜到本专栏的人,大多是认可了炒股用强化学习可能是最适合的这一假说,所以本文只对强化学习核心结构做描述,如果你已经学过可大概看看甚至可以跳过本节。
我们始终站在输入-输出
的模型来看问题,这样更简化对复杂问题的理解。
强化学习,是输入-输出
模型的细化,输出
将作为输入
的判定依据,影响输入
,而输入
也会影响输出
。这是一个输入-输出
相互反馈的系统。
最笼统的