![](https://img-blog.csdnimg.cn/20190918140012416.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
强化学习
文章平均质量分 62
强化学习理解
霍迪迪
音视频开发、C++
展开
-
强化学习-Q_learnning 算法遇到得一些python函数问题
pd.DataFrame()函数:直观理解就是创建一个表格,默认参数:def __init__(self, data: Any = None, index: Optional[Collection] = None, columns: Optional[Collection] = None, dtype: Union[ExtensionDtype, str, dtype, dtype, Typ..原创 2021-11-23 09:02:18 · 202 阅读 · 0 评论 -
强化学习第一步:Q_learning 算法,Q现实与Q估计分不清楚?我来说说我的理解
Q_learning 算法,Q现实与Q估计分不清楚Q_learning 算法的一些简介公式Q现实与Q估计Q_learning 算法的一些简介是一种与模型无关的强化学习算法,直接优化一个可迭代计算的Q函数。其他的算法思想很多博客都有写过,在此我就不再赘述啦,值得注意的是他是一种离线学习(off-policy)公式他所利用的公式呢主要有:贝尔曼方程 :在这里Bellman方程实际上就是价值动作函数的转换关系(我就不推到啦)时间差分法 ;时间差分法也就是 Q的更新函数间差分方法结合了蒙特卡罗的采样原创 2021-04-11 21:02:22 · 1732 阅读 · 0 评论