TensorFlow
文章平均质量分 56
断情冢
这个作者很懒,什么都没留下…
展开
-
DDPG框架的搭建&pendulum-V0环境构建
DDPG框架的搭建&pendulum-V0环境构建一、pendulum-v0环境的搭建1.系统示意图2.拉格朗日方程3.状态方程4.仿真方程5.reward定义6.python程序二、DDPG的实现1.程序流程图2.代码实现一、pendulum-v0环境的搭建1.系统示意图2.拉格朗日方程3.状态方程4.仿真方程5.reward定义6.python程序import numpy as npclass pendulum: def __init__(self):原创 2020-09-16 14:58:10 · 5611 阅读 · 2 评论 -
TensorFlow2实现Policy Gradient
TensorFlow2实现Policy Gradient一、原理二、网络搭建三、学习过程四、利用训练好的模型进行控制一、原理我找了很多资料,我发现李宏毅讲的是最清楚的:将这个图在具体一下,就是policy gradient的工作图了:下面的代码就是按照这个流程图实现的。二、网络搭建PG_Brain.pyimport tensorflow as tffrom tensorflow.keras import layersimport numpy as npclass PG:原创 2020-09-06 22:05:30 · 804 阅读 · 0 评论 -
tensorflow2搭建DeepQNet框架
tensorflow2搭建DeepQNet框架关于DQN的工作过程可以参考以下图片:图片来自链接: https://zhuanlan.zhihu.com/p/70009692.结合莫烦的机器学习教程,我总结了我搭建的DQN的步骤以及过程。参数的初始化。import tensorflow as tffrom tensorflow.keras import layersimport numpy as npclass DeepQNetwork: def __init__(原创 2020-09-03 21:49:22 · 592 阅读 · 0 评论