深度强化学习
爱发呆de白菜头
从事视觉SLAM,研究基于单目, 单目+IMU,RGB-D的SLAM算法, 有时侧重三维重建(地图, 渲染,分割,识别等), 有时侧重定位(VO,VIO等)。
展开
-
DRL学习第二课: 方法学习和探索
探索与利用序列决策的一个基本问题:探索Exploration:尝试更多的决策,不一定是最优收益,可能发现更好的策略利用Exploitation:执行能够获得已知最优收益的策略“策略探索的原则”1. 朴素方法2. 积极初始化3. 基于不确定的度量4. 概率匹配“案例: 多臂老虎机”"详细阐述和分析"1. 朴素方法Naive Exploration 添加噪声策略2. 积极初始化Optimistic Initialization a. 给价值函数一个较高的初始化值 b.原创 2020-08-04 14:27:05 · 380 阅读 · 2 评论 -
DRL学习第一课: 结构梳理和理清概念
近期在忙一个比较重要的项目, 做到机器人快速避障,正在努力学习和更新中.深度强化学习(Deep Reinforcement Learning)强化学习是机器学习的一个分支, 相较于机器学习经典的有监督学习, 无监督学习问题, 强化学习的最大的特点是在交互中学习(Learning from Interaction).Agent在与环境的交互中根据获得奖励或惩罚不断的学习知识, 更加适应环境.RL学习的范式非常类似于我们人类学习知识的过程, 也正因此, RL被视为实现通用AI重要途径.强化学.原创 2020-07-20 10:39:02 · 823 阅读 · 0 评论