强化学习——基础概念科普
本文的参考资料均来自飞桨PaddlePaddle的强化学习七日课程,这里仅做总结。强化学习的核心思想:智能体agent在环境environment中学习,根据环境的状态state,执行动作action,并根据环境的反馈奖励reward来指导更好的动作。两部分:agent 智能体、environment环境三要素:state状态/ observation观察值、action动作、reward奖励一个生动的例子来说明:强化学习的应用:1.小鸟游戏:小鸟作为agent,当前场景为sta
复制链接