自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 DQN学习笔记

本文是DQN的学习笔记,学习内容为知乎上关于DQN的介绍。原文链接为https://zhuanlan.zhihu.com/p/21262246?refer=intelligentunit文章目录机器学习与RL:Value func and action value func:Value iteration:Q-Learning:Q-Learning的缺陷:维数灾难DQN:机器学习与RL:增强学习在某种程度上也可看成机器学习的一种:做很多次实验,每次实验得到一组数据样本{(s0,a0,r0),(s1

2021-08-31 22:26:57 137

原创 李宏毅深度强化学习笔记

文章目录增强学习(RL)的一些基本概念:RL的基本组成:三者相互作用的过程:Policy:轨迹的概率:Expected Reward:Policy gradient:On-policy→\rightarrow→Off-policyImportance Sampling:PPO:注:增强学习(RL)的一些基本概念:RL的基本组成:1-actor:即操纵/需要学习的对象,如飞机大战里的飞机2-environment:外部环境,如飞机大战里除了飞机以外的所有东西,他们均为游戏内部设定3-reward:回

2021-08-31 21:55:17 753

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除