强化学习
文章平均质量分 71
周某某的blog
Green hand
展开
-
Reinforcement Learning——Different Policies
Evaluative Feedback 不同于instructive feedback,Evaluative Feedback完全取决于当前action,而instructive feedback完全独立于action,与action 无关。 为了简化问题,我们只考虑在一个状态下的情况,不考虑连续多个状态下action的选择。Qt(a)=r1+r2+……+rkakaQ_t(a)=\frac{r_1原创 2015-06-07 11:57:35 · 492 阅读 · 0 评论 -
Python包RLPY初识(一)
第一次发博客有点小紧张 _(:зゝ∠)_ (本文将简单介绍一下Python包RLPY) 下面先给出链接:该网站可查看RLPY架包的文档说明 安装RLPY可选择直接使用pip安装工具:pip install -U rlpy MACOS:xcode-select –install 另外还可以下载源码后执行python setup.py install安装。 过程中可能需要另外一些Python原创 2015-06-03 00:17:33 · 1642 阅读 · 0 评论