强化学习
文章平均质量分 53
好程序不脱发
这个作者很懒,什么都没留下…
展开
-
PPO算法基本原理及流程图(KL penalty和Clip两种方法)
PPO算法基本原理及流程图(KL penalty和Clip两种方法)原创 2023-06-30 17:06:28 · 12084 阅读 · 5 评论 -
PPO算法基本原理(李宏毅课程学习笔记)
PPO算法基本原理(李宏毅课程学习笔记)原创 2023-06-29 15:35:22 · 759 阅读 · 0 评论 -
PolicyGradient算法玩CartPole和MountainCar代码Pytorch版本
PolicyGradient算法玩CartPole倒立摆和MountainCar小车爬山的Pytorch版本代码原创 2023-06-29 15:24:51 · 232 阅读 · 1 评论 -
Policy Gradient策略梯度算法详解
Policy Gradient策略梯度算法原理原创 2023-05-16 16:47:51 · 4258 阅读 · 0 评论 -
DQN基本概念和算法流程(附Pytorch代码)
DQN,Deep Q Network本质上还是Q learning算法,它的算法精髓还是让Q估计尽可能接近Q现实,或者说是让当前状态下预测的Q值跟基于过去经验的Q值尽可能接近。在后面的介绍中Q现实也被称为TD Target相比于Q Table形式,DQN算法用神经网络学习Q值,我们可以理解为神经网络是一种估计方法,神经网络本身不是DQN的精髓,神经网络可以设计成MLP也可以设计成CNN等等,DQN的巧妙之处在于两个网络、经验回放等trick。原创 2023-04-14 14:46:23 · 8937 阅读 · 1 评论 -
Q-learning算法介绍
Q-learning算法原理原创 2023-04-07 15:25:17 · 2312 阅读 · 0 评论 -
强化学习教程学习比较-持续更新
强化学习教程学习比较-持续更新原创 2022-11-04 15:18:17 · 78 阅读 · 0 评论 -
强化学习学习笔记——问题汇总
在学习王树森教授讲解的强化学习教学过程中,遇到了几个理解上的小问题,所以写了这篇帖子记录下原创 2022-11-04 15:08:35 · 366 阅读 · 0 评论 -
jupyter notebook修改默认目录
jupyter notebook启动画面默认是C盘用户目录,参照下面的方法一修改默认目录之后,参考网址 https://www.cnblogs.com/Xieyang-blog/p/8542210.html出现问题描述:(1)Anaconda Prompt命令行jupyter notebook启动可以到修改目录下(2)Jupyter Notebook直接启动还是到C盘用户目录下于是冒着可能启动失败的风险,采用链接参考网址中的方法二,可以解决了在此备份下jupyter notebook属性中的最初原创 2021-06-09 11:33:55 · 88 阅读 · 0 评论 -
强化学习小车爬山进阶QLearning→A3C
随机选择action特别感谢这位博主的分享,代码亲测注释详细、效果超群https://blog.csdn.net/weixin_42454034/article/details/111194389QLearning选择action同样非常感谢这位博主的分享,代码亲测注释详细、效果超群https://blog.csdn.net/weixin_42454034/article/details/111194389A3C训练小车爬山感谢这位博主的分享,这是一份言简意赅的代码,训练过程中小车..原创 2021-06-03 16:49:53 · 1032 阅读 · 0 评论 -
强化学习玩Doom游戏安装vizdoom库debug指南
安装vizdoom库网络太差,pip install vizdoom库从官网下载非常缓慢,果断放弃到pypi.org上下载源包,tar.gz安装遇到困难,安装错误是bugVizDoom安装失败( RuntimeError: Building pip package on Windows is not currently available)查找上面的bug,一位好心人已经解决过这个问题 https://blog.csdn.net/weixin_39550091/article/details/..原创 2021-05-31 18:05:30 · 621 阅读 · 0 评论 -
DQN玩Atari游戏安装atari环境bug指南
1.遇到bug:缺少atari.py怎么办→在pypi.org官网上下载atari_py-0.2.9-cp36-cp36m-win_amd64.whl,因为我安装的python环境是3.6版本,在Anaconda Prompt里边将目录定位在whl的下载路径,pip install atari_py-0.2.9-cp36-cp36m-win_amd64.whl安装成功啦2.遇到bug:ROM找不到环境怎么办这句bug里边链接了Github的一个网站,https://github.com/openai原创 2021-05-29 10:52:42 · 2094 阅读 · 6 评论 -
2021-04-05
深度强化学习叮咚!深度Q网络→用深度神经网络学习Q值原创 2021-04-05 11:49:22 · 45 阅读 · 0 评论 -
强化学习-蒙特卡洛解决21点游戏小小知识点
参考代码代码的出处:https://blog.csdn.net/ZhangRelay/article/details/91867331import gymimport numpy as npfrom matplotlib import pyplotimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom collections import defaultdictfrom functools imp原创 2021-02-07 23:30:49 · 432 阅读 · 0 评论 -
强化学习对于冰冻湖的更更更深刻理解
问题来源问题来源背景是在学习强化学习的冰冻湖小例子,输出最优策略是[0,3,3,3,0,0,0,0,3,1,0,0,0,2,1,0],不理解这个最优策略啊,开始一路找答案深刻理解参考《gym冰冻湖环境学习笔记》, 一起来围观吧 https://blog.csdn.net/qq_20805805/article/details/104195493?utm_source=app&app_version=4.5.0对于不确定性的理解...原创 2021-02-07 23:12:20 · 477 阅读 · 0 评论 -
强化学习 OpenAI Gym Universe Docker在Windows WSL 2安装配置最全的全记录
1. 事情的起源全记录事情的起源是为了学习Python强化学习实战,先在自己的windows操作系统的Pycharm+Anaconda+Gym配置下运行成功了CartPole示例和CarRacing示例,接着运行Universe,据说OpenAI Universe需要在Docker的镜像下运行,在安装Docker的时候偶然遇到了WSL 2,既然windows有WSL 2的Linux环境,那么直接在Linux分发上做运行,然而从此事情变得不简单了。2. 在Win10家庭版上安装Docker下载安装Doc原创 2021-02-02 10:58:58 · 2250 阅读 · 9 评论