深度学习、强化学习、深度强化学习简要介绍

Nwiliuyw

已于 2024-04-11 23:57:55 修改

阅读量361

点赞数 8

文章标签：学习人工智能

于 2024-04-11 23:55:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wywzb/article/details/137657456

版权

深度学习：

通过模仿人脑神经网络的结构和功能来实现对数据的学习、分类和模式识别。通过多层次的神经网络结构来自动学习特征表示，从而实现对复杂数据的高效处理和分析。

说简单点，就是：通过大量的数据输入和神经网络的层层处理，从数据中提取特征并进行分类、回归等任务。

强化学习：

目标是通过与环境的交互来学习最优的行为策略，以达到最大化预期的累积奖励。在强化学习中，智能体通过观察环境的状态、执行动作并接收奖励来学习最佳的决策策略。

讲白了就是训练一个智能体，通过不断的试错，让它从一个白痴变成高手。

深度强化学习：

在强化学习的某些任务环境中这些环境可能会非常复杂，依靠单纯的强化学习已经无法满足需要，这个时候就需要引入深度学习来帮忙了。目标就是实现智能体在复杂环境中的高效决策。

最经典的深度强化学习算法就是DQN算法，在这个算法提出后又发展出了double DQN，分布dqn，彩虹dqn等等一系列dqn衍生算法。

在这里推荐一个非常好用的强化学习库，stable_baselines3库，里面内置了一堆好用的RL算法，DQN，PPO等等都在里面，真正做到开箱即用。

关注

8
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Nwiliuyw CSDN认证博客专家 CSDN认证企业博客

码龄2年

18: 原创

118万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

437: 积分

272: 粉丝

254: 获赞

12: 评论

122: 收藏

私信

关注

热门文章

最新评论

电子技术基础II-复习（模电+数电）
Nwiliuyw: clk同志，没想到为了看baba我的文章还特定注册了一个账号，我太感动了
电子技术基础II-复习（模电+数电）
2401_85595299: 建议你不要在这发，在小红书上发
什么叫上升沿，什么叫下降沿
CSDN-Ada助手: 恭喜用户撰写第11篇博客！关于“上升沿”和“下降沿”的解释很清晰易懂，让人受益匪浅。希望用户能继续保持创作的热情和努力，为读者带来更多有启发性的内容。或许接下来可以深入探讨一些实际案例或者应用场景，让读者更好地理解和应用这些概念。期待用户的下一篇作品！
什么是存储电路，什么是组合逻辑电路以及什么是时序逻辑电路
CSDN-Ada助手: 恭喜您写了第10篇博客，内容涉及存储电路、组合逻辑电路和时序逻辑电路，让读者更深入地了解了这些概念。接下来，建议可以深入探讨这些电路在实际应用中的具体案例，或者结合实验或仿真结果进行说明，让读者更直观地理解这些概念。希望您继续保持创作热情，为读者带来更多有价值的内容。
二叉树基于队列实现的非递归广度优先遍历
CSDN-Ada助手: 恭喜用户写出了第8篇博客，“二叉树基于队列实现的非递归广度优先遍历”！这篇博客内容深入浅出，让读者能够清晰地理解非递归广度优先遍历的实现方法。希望用户能继续保持创作的热情和努力，探索更多有趣的话题。或许下一步可以考虑分享一些实用的算法优化技巧，或者结合实际案例进行深入分析，让读者更加受益。期待用户的下一篇精彩作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。