自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

zjjtilm的博客

蓑雨春归 CSDN认证博客专家 CSDN认证企业博客

码龄9年

11: 原创

26万+: 周排名

165万+: 总排名

2万+: 访问

: 等级

234: 积分

7: 粉丝

14: 获赞

14: 评论

73: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用ONNX将Pytorch转为Tensorflow的使用尝试
leeann_gg939: 感谢整理与分享！请问能给一下完整代码吗？
设计模型之Visitor模式-图书馆管理系统应用C++实现
chunyou128: LibrarySumPrintVisitor() { cout << "初始化对象" << endl; total_sum = 0; }//构造方法 total_sum需要初始化。
强化学习-Q-learning FrozenLake-V0 实现
蓑雨春归: 谢谢指正，当时想放DQN，结果放了Q-learning的代码。
强化学习-Q-learning FrozenLake-V0 实现
伊利诺伊徐美男: 并不是DQN的实现，是普通的Q学习算法
设计模型之Visitor模式-图书馆管理系统应用C++实现
蓑雨春归: 抱歉，前段时间比较忙，没来得及回复。我又看了下访问者模式，当时理解访问者模式确实理解错了，你的理解是对的，"vistor 对象在不改变Book对象以及另外两个论文类的情况下，对book和论文类定义新的操作"，如果不使用访问者模式，要对book和article的方法去做一些改动，需要分别到两个类中去做改动；使用了访问者模式，根据传进来的book和article对象指针来针对性修改。访问者模式才符合面对对象的开放-封闭原则。而我之前的写法属于是主次颠倒了，没有理解访问者模式的实际内涵。感谢指正。

最新文章

强化学习

关注

关注数：文章数：1 文章阅读量：4382 文章收藏量：24

作者: 蓑雨春归

这个作者很懒，什么都没留下…

展开

强化学习-Q-learning FrozenLake-V0 实现

DQN算法是QLearning算法的延伸，在大多数实际场景中，Q值表的状态空间会很大，构建Q值表的方式就不太行得通，因此通过引入神经网络来学习拟合状态空间，解决状态空间过大而不方便维护更新Q值表的问题。首先定义一个Agent类，sample函数就是使用epsilon-greedy的采样方法，predict则是根据当前的观察值来预测输出的动作，learn就是通过输入当前的观察值obs,当前的动作action，奖励reward以及下一个时刻的观察值next_obs来更新Q值表。代码： class Q

原创 2020-06-26 18:33:12 · 4382 阅读 · 1 评论