强化学习
YYYa77
这个作者很懒,什么都没留下…
展开
-
DQN、DDQN、Dueling DQN、PER DQN
DQNDDQN(Double DQN)DQN中的q值总是被高估了DQN中使用一个神经网络Q,计算每一个action的的Q值,选择Q值最大的action加上rtDDQN中使用两个神经网络Q、Q’,使用Q计算action的Q值,选择Q值最大的action,使用Q’计算被选择action的Q’值。Dueling DQN相比于DQN只更改了网络的架构DQN中的Q是直接输出一个Q值Queling DQN是将输出分为价值函数和动作函数,价值函数输出一个实数,表示对当前局势的价值量,动作函数输出每原创 2022-04-29 13:23:48 · 2749 阅读 · 0 评论 -
TensorBoard遇到的一些问题
1.找到“tensorboard.exe”所在目录(在python运行环境目录中)2.打开cmd,并转到“tensorboard.exe”所在目录3.在cmd中输入tensorboard --logdir=日志路径地址4.在浏览器中打开此网址原创 2021-08-24 18:57:25 · 246 阅读 · 0 评论 -
人工智能、机器学习、深度学习、强化学习、深度强化学习
人工智能 (Artificial Intelligence):人工智能研究的各个分支包括计划调度、专家系统、多智能体系统、进化计算、模糊逻辑、机器学习、知识表示、计算机视觉、自然语言处理、推荐系统、机器感知等等。机器学习(Maching Learning):是实现人工智能的一种手段深度学习(Deep Learning):是一种机器学习的技术。通过大量的数据训练,发现数据的规律,从而实现基于监督学习的数据预测,需要有监督的方式训练模型,训练的结果严重的依赖于标签的质量。强化学习(Reinforcemen原创 2021-08-17 14:46:48 · 1311 阅读 · 0 评论