![](https://img-blog.csdnimg.cn/9572947b56c34dd3b861df32d1ea8d39.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
强化学习
文章平均质量分 88
想训练AI游戏,呜呜呜
百度pkq
蒟蒻的训练家,有一只不会十万伏特、不会卖萌、不会装逼、只会百度的皮卡丘
展开
-
强化学习--tf2.4 超级马里奥(super mario) PPO复现
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、安装库二、使用步骤总结前言我真的是醉了,刚开始无意间看到超级马里奥的强化学习,我就想学,然后。。。花了我零零散散一周的时间来从最初的Q_Learning,sarsa到高级的DQN,PG,DDPG再到最后的AC,A3C,PPO,我真的觉得没点看头,不知道学完之后能不能搞SuperMario,很不错,tf2.x的马里奥被我复现了。一、安装库之前学习的一直是Gym的环境,高级一点的游戏就是gym_super_mario.原创 2022-04-25 22:07:34 · 5777 阅读 · 3 评论 -
强化学习--PPO(完结)
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(PPO近端策略优化) Proximal Policy Optimization多线程版本的例子总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是原创 2022-04-24 19:50:12 · 8366 阅读 · 2 评论 -
强化学习--A3C
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(A3C) Asynchronous Advantage Actor-critic前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是原创 2022-04-24 19:27:59 · 942 阅读 · 0 评论 -
强化学习--Deep Deterministic Policy Gradient
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习)Deep Deterministic Policy GradientDDPG基于Actor_Critic中改善了啥呢?前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特原创 2022-04-24 15:28:36 · 2936 阅读 · 0 评论 -
强化学习--Policy Gradients
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(策略梯度法)Policy Gradients总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的原创 2022-04-23 21:29:05 · 258 阅读 · 0 评论 -
强化学习--Dueling DQN
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习)Dueline DQN总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式进行原创 2022-04-23 20:39:40 · 543 阅读 · 0 评论 -
强化学习--Prioritised Replay DQN
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习)Prioritised Replay DQN总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent原创 2022-04-23 20:28:13 · 432 阅读 · 0 评论 -
强化学习--DoubleDQN
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习)Double DQN总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式进行学原创 2022-04-23 19:20:47 · 1806 阅读 · 0 评论 -
OpenAIGym环境
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心点(环境)安装方法用法:小车上坡的例子总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式进行学习原创 2022-04-23 16:42:04 · 1923 阅读 · 0 评论 -
强化学习--DQN2
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习) DQN(先学会1.0的再搞2.0的)总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“原创 2022-04-23 15:36:24 · 1911 阅读 · 0 评论 -
强化学习--DQN
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习) DQN1.什么是DQN?总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式原创 2022-04-18 10:45:44 · 1449 阅读 · 0 评论 -
强化学习--Sarsa
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(免模型学习) Sarsa1.学习心得前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式进行学习原创 2022-04-18 10:21:27 · 530 阅读 · 0 评论 -
强化学习--QLearning
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(免模型学习) QLearning1.未记录学习心得总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试原创 2022-04-18 09:38:01 · 597 阅读 · 0 评论