零基础机器学习做游戏辅助第九课--强化学习DQN（一）

人工智能-肥鹅

已于 2023-03-18 16:37:40 修改

阅读量580

点赞数

分类专栏：机器学习制作游戏辅助-原神自动钓鱼实战文章标签：人工智能做游戏辅助深度神经网络强化学习做游戏辅助神经网络做游戏辅助 Powered by 金山文档

于 2023-02-03 22:01:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kfyzjd2008/article/details/128850666

版权

机器学习制作游戏辅助-原神自动钓鱼实战专栏收录该内容

15 篇文章 8 订阅 ¥399.90 ¥499.90

订阅专栏

本文介绍了强化学习的基础知识，包括强化学习的概念和Q-learning算法，详细阐述了Q-learning的行为选择、决策和更新过程。接着，文章讲解了DQN与Q-learning的区别，即通过神经网络解决Q-table的规模问题。此外，还介绍了OpenAI Gym环境，特别是CartPole推车杆问题，作为实践强化学习的示例。最后，总结了Q-learning、DQN和OpenAI Gym在强化学习中的作用。

摘要由CSDN通过智能技术生成

一、强化学习简介

强化学习（英语：Reinforcement learning，简称RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。强化学习是除了监督学习和非监督学习之外的第三种基本的机器学习方法。与监督学习不同的是，强化学习不需要带标签的输入输出对，同时也无需对非最优解的精确地纠正。其关注点在于寻找探索（对未知领域的）和利用（对已有知识的）的平衡，强化学习中的“探索-利用”的交换，在多臂老虎机问题和有限MDP中研究得最多。

强化学习是比监督学习更优秀的一种机器学习方法，监督学习需要有数据和对应的正确标签来进行训练，强化学习前期并没有数据和标签，它需要在环境中不断尝试，发现规律然后得到更高的奖励。

二、认识Q-learning算法

Q-learning是我们学习强化学习的一个基础算法。在此基础上我们再去延伸。

行为选择

了解本专栏

人工智能-肥鹅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
零基础机器学习做游戏辅助第九课--强化学习DQN（一）

强化学习（英语：Reinforcement learning，简称RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。强化学习是除了监督学习和非监督学习之外的第三种基本的机器学习方法。与监督学习不同的是，强化学习不需要带标签的输入输出对，同时也无需对非最优解的精确地纠正。其关注点在于寻找探索（对未知领域的）和利用（对已有知识的）的平衡，强化学习中的“探索-利用”的交换，在多臂老虎机问题和有限MDP中研究得最多。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

人工智能-肥鹅 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。