自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

张一

2022-07 强化学习教程

关注

文章平均质量分 90

关注数：文章数：1 文章阅读量：1153 文章收藏量：1

作者: 张一%

这个作者很懒，什么都没留下…

展开

2022-01 task01 强化学习基础（教程第一章+对应习题）（2天）

强化学习(Reinforcement Learning) 用来学习如何做出一系列好的决策。一个智能体(agent)怎么在一个复杂不确定的环境(environment)里面极大化能获得的奖励。agent在环境里面获得状态，利用这个状态输出一个动作action(决策)，然后这个决策会放到环境中去，环境根据agent采取的决策，输出下一个状态以及当前动作action(决策)得到的奖励。Agent的目的是为了尽可能多的从环境中获得奖励。人工智能的基本挑战是学习在不确定的情况下做出的好的决策。监督学习：1）输入的数据

原创 2022-07-12 16:38:34 · 1153 阅读 · 0 评论