强化学习笔记
一、什么是强化学习1.定义强化学习(Reinforcement Learning, RL),用于描述和解决智能体(agent)在与环境的交互过程中以“试错”的方式进行学习,以达成回报最大化或实现特定目标的问题。不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。2.模型强化学习把学习看作试探评价过程,Agent选择一个动作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给Agent,Agent根据强化信
原创
2021-07-17 20:14:24 ·
142 阅读 ·
0 评论