- 博客(3)
- 收藏
- 关注
原创 坚持学习 -- 强化学习(3)
莫烦强化学习课程的小例子探索值搜寻宝藏,一维地图,方向只有左右。不断尝试,找到最短的路径。运行效果:按视频写的代码:详细内容请参考莫烦Python:https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/general-rl/...
2021-08-24 13:40:44 108
原创 坚持学习 -- 强化学习(2)
Q-Learning(1). 什么是Q-Learning :Q-Learning是一种决策过程,选择潜在奖励大的行为。本次行为选择后,产生下一次状态。根据Q-table中的状态(s1,s2,s3...)选择相应的奖励值(R)较大的行为(a1,a2,a3...)。(2). 此处有两个值需要注意:估计值和现实值。估计值: 当到达某一状态(s1),根据Q-table估计下一步的行为是奖励值较大的行为(a2)。也就是估计出的Q值是Q(s1,a2)现实值...
2021-08-24 13:11:13 160
原创 坚持学习 -- 强化学习(1)
萌新一枚,目前研究V2X。最近想要探索一下人工智能领域,各种网站寻找资源,最后选定莫烦大神的课程。毕竟是从头学习,没有一点基础,想要凭借平台记录自己的学习点滴,当做一种笔记形式。第一步想要先学习 Reinforcement Learning 强化学习。以下是第一次课堂笔记。强化学习概念: 是一类算法,使计算机能够从无到有,不断试错不断学习最后找到达到目标的过程。强化学习方法分类:按分类标准不同的分类详情内容参考莫烦Python:https://mofanpy.com.
2021-08-24 10:26:57 221
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人