![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AI算法#强化学习
文章平均质量分 75
BaiYunTu.COM
BaiYunTu.COM 我在这里
展开
-
基于强化学习的智能球球大作战
这是一个基于 Pygame 的强化学习项目,目的是展示 Q-learning 在一个简单游戏中的应用。玩家可以手动操作,也可以观看智能体如何通过自我训练来学习最佳策略。点击了解更多。原创 2024-07-08 11:21:48 · 329 阅读 · 1 评论 -
基于深度确定性策略梯度(DDPG)算法的强化学习智能体
这个代码实现了一个基于深度确定性策略梯度(DDPG)算法的强化学习智能体,并应用于一个名为的控制任务中。DDPG 是一种适用于连续动作空间的强化学习算法,结合了深度 Q 网络(DQN)和策略梯度方法的优点,通过两个神经网络(Actor 和 Critic)分别生成动作和评估动作的价值。原创 2024-07-03 23:31:57 · 910 阅读 · 0 评论