（7-3）DDQN（双重深度 Q 网络）：超级马里奥游戏的DDQN强化学习实战（2）

最新推荐文章于 2024-03-11 16:05:50 发布

码农三叔

最新推荐文章于 2024-03-11 16:05:50 发布

阅读量1.3k

点赞数 51

分类专栏：强化学习从入门到实践文章标签：游戏 python 人工智能机器学习深度学习神经网络

本文链接：https://blog.csdn.net/asd343442/article/details/136185071

版权

强化学习从入门到实践专栏收录该内容

77 篇文章 2 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文详细描述了如何使用DDQN算法在超级马里奥游戏中进行模型训练和测试，涉及show_state函数用于实时可视化游戏状态，以及run函数实现训练和测试逻辑，包括参数配置、环境预处理、模型训练和保存。

摘要由CSDN通过智能技术生成

7.3.5 模型训练和测试

本阶段将实型一个整体的训练和测试流程，包含了训练和测试的功能。

（1）定义函数show_state()，其主要功能是在测试过程中显示超级马里奥游戏的环境状态。具体实现代码如下所示。

def show_state(env, ep=0, info=""):
    """在测试时显示超级马里奥游戏环境的状态"""
    plt.figure(3)
    plt.clf()
    plt.imshow(env.render(mode='rgb_array'))
    plt.title("Episode: %d %s" % (ep, info))
    plt.axis('off')

    display.clear_output(wait=True)
    display.display(plt.gcf())

函数show_state(env, ep=0, info="")接受如下所示的3个参数：

了解本专栏

超级会员免费看

码农三叔

关注

51
点赞
踩
27

收藏

觉得还不错? 一键收藏
打赏
0
评论
（7-3）DDQN（双重深度 Q 网络）：超级马里奥游戏的DDQN强化学习实战（2）

具体实现代码如下所示。通过上面的这些参数，代码将测试一个使用 Double DQN 算法的代理在指定的游戏世界和阶段中的性能，共执行 20 个测试回合，并输出性能结果。通过上述参数，代码将训练一个使用 Double DQN 算法的代理，在指定的游戏世界和阶段中进行学习，共执行 5000 个回合，并在训练期间保存相关数据和模型权重。函数show_state()通常在测试超级马里奥游戏环境时使用，以实时可视化游戏的进行和状态，它会在Jupyter Notebook中显示游戏屏幕的图像，以便观察游戏的执行情况。
复制链接

扫一扫