自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_52797432的博客

Sparks Fly ~ CSDN认证博客专家 CSDN认证企业博客

码龄4年

12: 原创

122万+: 周排名

10万+: 总排名

4390: 访问

: 等级

195: 积分

46: 粉丝

64: 获赞

7: 评论

60: 收藏

私信

关注

热门文章

分类专栏

强化学习小实验 1篇

最新评论

OPE in RL|强化学习中的离策略评估方法
Sparks Fly ~: https://github.com/hari-sikchi/safeRL hcope link
tf/encoder|Error合集
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
RL强化学习基础|Q learning|test on FrozenLake代码小实验
CSDN-Ada助手: 恭喜用户发布了第9篇博客！标题中提到了Q learning在强化学习中的应用，以及在FrozenLake环境中的代码小实验，内容相当丰富和有趣。希望用户继续坚持创作，可以考虑分享更多关于RL强化学习算法的实践经验或者进阶内容，让读者可以更深入地了解这个领域。期待用户的下一篇博客！
强化学习sepsis论文复现|02 数据准备：在postgresql本地安装mimic-iii数据集
Sparks Fly ~: https://blog.csdn.net/2301_78042158/article/details/130617621?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-130617621-blog-134451815.235^v43^pc_blog_bottom_relevance_base9&spm=1001.2101.3001.4242.2&utm_relevant_index=4
python pickle
CSDN-Ada助手: 恭喜您写了这篇关于“python pickle”的博客！持续创作真的很棒，我非常期待您的下一篇文章。如果可能的话，我建议您可以尝试写一些关于Python中其他常用模块的文章，比如numpy或者pandas，这样可以让更多的读者受益。不过话说回来，我知道您一定已经有自己的计划，期待您更多精彩的文章！

最新文章

强化学习小实验

关注

文章平均质量分 58

关注数：文章数：1 文章阅读量：249 文章收藏量：1

作者: Sparks Fly ~

这个作者很懒，什么都没留下…

展开

RL强化学习基础|Q learning|test on FrozenLake代码小实验

Frozen Lake游戏的设定是有slippery （有滑动，即env.step(action)不一定是指的前面选出来的action，有一定概率是其他的方向）和 not slippery（不滑动，即env.step(action)就是指的前面选出来的action，类似于deterministic policy），图如下，根据小人的状态有不同的情况：（图表示每100个episode的累计奖励）epsilon指的是选择探索的改了吧，大部分时候探索的机会很小。main函数线运行15000 次。

原创 2024-03-02 01:32:44 · 249 阅读 · 1 评论