强化学习学习与实践
文章平均质量分 96
灰灰嗷
BIT/强化学习小萌新/欢迎大家一起讨论与批评指正
展开
-
【EasyRL强化学习学习笔记】01_相关原理与概述
文章目录本章笔记主要内容关键词相关参数定义1 强化学习与监督学习1.1 简单介绍1.2 二者区别1.3 强化学习特征1.4 强化学习发展2 强化学习基本原理2.1 动作2.2 奖励2.3 状态与观测2.4 策略、价值函数与模型2.4.1 策略2.4.2 价值函数2.4.3 模型2.5 智能体与环境2.5.1 根据学习对象分类2.5.2 根据是否有学习环境模型分类2.7 探索与利用3 一些实验例子3.1 Gym库的安装3.2 例1:CartPol_v0(平衡车)3.3 例2:MountainCar_v0(小.原创 2022-04-25 22:37:27 · 2239 阅读 · 0 评论 -
【论文精读与思考】:深度强化学习的组合优化研究进展
论文精读与思考:深度强化学习的组合优化研究进展原创 2022-04-19 17:52:36 · 4517 阅读 · 0 评论