强化学习
文章平均质量分 85
OverlordDuke
有意向请加企鹅:3159277216
展开
-
豆豆人智能AI游戏设计与Java实现
豆豆人是一款经典的游戏,而实现一个智能的豆豆人AI则是一项富有挑战性的任务。在这篇博客中,我们将介绍一个基于Java实现的豆豆人智能AI游戏。本游戏中的AI算法主要基于搜索算法,以下是主要使用的两种搜索算法:1. **深度优先搜索(DFS)**:在`andSearch`和`containsCycle`方法中,通过深度优先搜索遍历可能的游戏状态,以计算最大分数或检测路径中是否存在循环。2. **博弈树搜索**:通过`orSearch`方法实现了对可能结果的搜索,计算平均分数。博弈树搜索是博弈论中的经典原创 2024-01-04 17:11:20 · 1037 阅读 · 0 评论 -
CarRacing DQN: 深度 Q 学习训练自驾车
本博客深入剖析了使用 DQN 算法训练自驾车代理的过程。通过经验回放和目标网络的应用,模型逐渐学会优化 Q 值以实现更好的导航策略。深度 Q 学习为解决复杂环境中的决策问题提供了一种强大而灵活的方法,为自动驾驶领域的研究和应用提供了新的思路。原创 2024-01-05 20:30:48 · 1232 阅读 · 0 评论 -
Flappy Bird QDN PyTorch博客 - 代码解读
在本博客中,我们将介绍如何使用QDN(Quantile Dueling Network)算法,在PyTorch平台下训练Flappy Bird游戏。QDN算法是一种强化学习算法,特别适用于处理具有不确定性的环境,如游戏。原创 2024-01-04 23:03:22 · 1889 阅读 · 2 评论