Python Basic and Code
文章平均质量分 78
Python code and basic
lotylotylotyloty
有问题随时留言!博主很忙~,可能回复很慢,请大家见谅!看到了会回复的
展开
-
Conservative Q-Learning(CQL)保守Q学习(三)-CQL在DDPG下的代码实现和实际应用效果
一些,但是笔者在此问题"BipedalWalker-v3"中并未发现它的明显优势,只能说在Reward的结果上,两者差距并不是很大,并且还存在着偶然性。可能是由于10W的数据集采用Batch=256来采样效果可能稍差一些并且存在一定的偶然性。4.用户可以直接运行OFFLineT_CQL.py与OFFLineT_QL.py两个文件来分别对应的加入了CQL的DDPG和未加入CQL的DDPG算法,得到结果并画图。笔者对CQL进行了实现和原文章代码部分的修改,放在了下面的链接里,欢迎各位对代码提出点评和修正。原创 2023-04-01 14:38:06 · 669 阅读 · 10 评论 -
Tensorflow&numpy&keras比较详细的学习笔记(附每一个函数的示例代码和练习程序)
笔者结合北京大学Tensorflow学习网课和一些个人理解对Tensorflow进行了系统化的学习和笔记总结,里面包括了从基础的张量创建到深入的进行构造BP,CNN,RNN等网络模型的Tensorflow_keras实现和改进,并利用北京大学Tensorflow学习网课中的样例进行了自我调整和实现。本文可供和笔者一样的网络初学者使用和参考,也可供时间不允许,需要迅速使用网络框架的学者参考,如需查阅详细CNN,RNN,LSTM,DHNN等详细构造和数学推导,笔者这里推荐各位一本不错的书:《Neural Ne原创 2021-10-07 21:45:22 · 828 阅读 · 1 评论