- 博客(1)
- 收藏
- 关注
原创 基于深度强化学习的机器人手臂控制|学习笔记
简介:利用深度强化学习对机器人手臂的控制背景知识:强化学习原理:如果智能体对某些动作进行奖励,之后执行该动作的概率就会增加;反之,若惩罚,执行概率就会降低。强化学习分类:基于价值的强化学习:分析所处环境,输出下一步行动的概率分布,根据概率分布采取行动。基于策略的强化学习:输出每种行动的价值,一般是基于最高价值来选择行动。将二者结合,就是actor-critic算法:演员基于策略作出...
2019-05-28 22:55:25 5547
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人