强化学习
文章平均质量分 94
chencjiajy
这个作者很懒,什么都没留下…
展开
-
连续时间LQR和离散时间LQR笔记
连续时间LQR和离散时间LQR原理理解笔记原创 2023-12-26 20:32:45 · 960 阅读 · 0 评论 -
优先经验回放(prioritized experience replay)
优先经验回放(prioritized experience replay)的原理和实现原创 2023-11-22 21:18:57 · 2319 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第8章笔记
《Reinforcement Learning: An Introduction》第8章Planning and Learning with Tabular Methods 表格型规划与学习方法 笔记原创 2023-09-29 08:52:06 · 217 阅读 · 0 评论 -
强化学习论文《Deep Reinforcement Learning that Matters》笔记
强化学习论文《Deep Reinforcement Learning that Matters》笔记原创 2023-07-23 15:42:23 · 314 阅读 · 0 评论 -
强化学习 GAE算法:HIGH-DIMENSIONAL CONTINUOUS CONTROL USINGGENERALIZED ADVANTAGE ESTIMATION》论文笔记
论文《HIGH-DIMENSIONAL CONTINUOUS CONTROL USINGGENERALIZED ADVANTAGE ESTIMATION》是策略梯度算法中常用的优势估计算法GAE对应的论文原创 2023-07-21 21:12:15 · 273 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第7章笔记
《Reinforcement Learning: An Introduction》第7章笔记,n-step Bootstrapping, n-step 时序差分原创 2023-07-02 22:32:37 · 186 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第6章笔记
《Reinforcement Learning: An Introduction》第6章笔记,介绍了时序差分算法。介绍了Q-learning 和Sarsa和期望Sarsa的流程。原创 2023-06-23 19:36:10 · 428 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第5章笔记
《Reinforcement Learning: An Introduction》第5章笔记,使用Monte Carlo 蒙特卡洛方法来实现强化学习原创 2023-06-18 15:51:04 · 434 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第4章笔记
《Reinforcement Learning: An Introduction》第4章动态规划笔记,本章总结了策略评估、策略提升、策略迭代、价值迭代等概念原创 2023-06-11 15:47:28 · 639 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第2章笔记
《Reinforcement Learning: An Introduction 强化学习》第2章笔记原创 2023-05-28 19:51:15 · 933 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第3章笔记
《Reinforcement Learning: An Introduction》强化学习第3章有限马尔科夫决策过程 笔记原创 2023-06-07 23:09:39 · 473 阅读 · 0 评论 -
《Reinforcement Learning: An Introduction》第1章笔记
《Reinforcement Learning: An Introduction》第二版 第一章笔记原创 2023-05-20 16:27:17 · 683 阅读 · 0 评论