什么是强化学习？

最新推荐文章于 2024-06-16 22:42:04 发布

志远1997

最新推荐文章于 2024-06-16 22:42:04 发布

阅读量467

点赞数 1

分类专栏：强化学习文章标签：强化学习人工智能算法机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33302004/article/details/114970596

版权

什么是强化学习？

文章目录

1. 强化学习可以应用的场景
2. 强化学习要解决的问题
3. 强化学习主要研究思路和研究点：
4. 强化学习与监督和非监督学习的对比
5. 强化学习的分类
6. 常用的技术和方法

1. 强化学习可以应用的场景

具体内容：游戏博弈、下棋、投资、课程安排、驾车、动作模仿；
应用领域：机器人控制、汽车智能驾驶、人机对话、过程优化决策与控制等。

2. 强化学习要解决的问题

智能决策问题，更确切的说是序贯决策问题；
所谓序贯决策问题就是需要连续不断的做决策才能实现最终目标的问题，如小车二级摆、下围棋、打电子游戏等。

3. 强化学习主要研究思路和研究点：

研究思路：
1. 挑战更难的问题，不断从次优解向最优解逼近；
2. 在不严重影响精度的情况下，降低算法的计算成本；
3. 提升算法的快速收敛性和泛化性。
研究点：分层强化学习、元强化学习、多智能强化学习、关系强化学习、迁移强化学习等。

4. 强化学习与监督和非监督学习的对比

机器学习（Machine Learning）算法常被分为监督学习（Supervised Learning）、非监督学习（Unsupervised Learning ）和强化学习（Reinforcement Learning）。
监督/非监督学习都是基于已经存在的静态数据进行机器学习，属于“开环学习”；而强化学习是采用动态数据ÿ

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
什么是强化学习？

什么是强化学习？文章目录1. 强化学习可以应用的场景2. 强化学习要解决的问题3. 强化学习主要研究思路和研究点：4. 强化学习与监督和非监督学习的对比5. 强化学习的分类6. 常用的技术和方法1. 强化学习可以应用的场景具体内容：游戏博弈、下棋、投资、课程安排、驾车、动作模仿；应用领域：机器人控制、汽车智能驾驶、人机对话、过程优化决策与控制等。2. 强化学习要解决的问题智能决策问题，更确切的说是序贯决策问题；所谓序贯决策问题就是需要连续不断的做决策才能实现最终目标的问题，如小车二级摆、
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。