一、引言
百度强化学习7日打卡课程,是百度推出的针对初学者的一门以实践为主的线上课程。这门课程可以帮助那些对强化学习充满兴趣但是没有基础的同学,在7天里,了解强化学习的概念,以及一些基础算法,最重要的是,可以通过一些有趣的项目实践,在理论学习的同时,动手完成有趣的小游戏,从而提升趣味性。
二、强化学习是什么
首先我们明确一点,计算机的不断发展,其核心目标是希望可以利用计算机代替人类,完成一些工作,从最早的单纯计算,到人工智能初始阶段的逻辑推理,再到机器学习,通过已有的先验知识对模型进行训练,从而完成诸如图像识别等工作。但是上述的所有过程,都是需要一定程度的先验知识,于是我们就想,能不能让计算机可以像人一样自主学习,通过与环境的交互,学习到相关的经验知识,从而完成训练,这就是强化学习。强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。
三、Sarsa&Q-learning
Sars
百度强化学习课程总结
最新推荐文章于 2022-01-24 16:43:12 发布
![](https://img-home.csdnimg.cn/images/20240611030827.png)