强化学习PCG---关卡生成心得

XVJackXV

于 2023-10-24 17:15:52 发布

阅读量217

点赞数

文章标签： AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57455568/article/details/133990007

版权

本文探讨了关卡生成的核心在于扩充数据集，方法包括VAE、GAN、遗传算法和强化学习等。通过递进式训练RL智能体和利用Bisimulation思想，针对数据集有限的情况提出逐步学习策略，帮助智能体适应不同难度的关卡。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

个人想法

个人认为关卡生成的本质实际上就是扩充关卡数据集，同时要保证生成的关卡可以被通过。
如果是扩充关卡数据集的话，像马里奥的话，其实就是图像生成图像（迷宫），或者是文本生成文本（因为马里奥的生成都是字符集）。
最后的关卡可通过，其实更多的就凭借A*智能体（马里奥）和一些已经训练好的智能体ACCEL（mini-grid）来测试通关即可。

扩充数据集

从这个角度上讲，扩充数据集的方法包括以下几种：

VAE：把已有的数据集映射到标准正态分布上，在训练完成后通过在标准正太分布上采样来生成新的关卡数据；
GAN：通过输入随机噪声（其实就是一种分布，比如正态分布），结合判别器，判别器的主要作用是判断生成的数据集是否是真实的数据集，那么实际上训练完成后得到的是随机噪声（假设是正态分布）到数据集真实分布的映射。
遗传算法：通常放在GAN生成后用；通过遗传和变异对已有的样本的隐变量进行进化搜索；
强化学习：这里有个问题是动作是怎么设计的?[同时训练两个RL智能体也比较难收敛，MDP的序列决策过程似乎并没有完全体现]
大语言模型：利用文本生成文本的技术，需要进一步了解一下

任务相关的生成

依托的环境：迷宫环境
主要围绕课程学习的思想，递进式地训练RL智能体，同时生成关卡。
借助一下Bisimulation的思想，认为序列奖励相同的情况下，他们的状态中存在相同的任务相关特征。
我认为原始的数据集分布可能并不适合当前的智能体来训练，对于刚开始训练的智能体来讲，难度可能比较大。此时，可以通过先学习原始的数据集，然后对原始数据集进行任务相关的扩充。

数据集有限的情况下或者说难的数据比较多时，此时很难让智能体从头开始训练。
比如说刚开始有一个复杂迷宫给智能体，但是可能我先给他一些简单的，然后就可以慢慢学会。

博客等级

码龄4年

18
原创

0
点赞

0
收藏

0
粉丝

关注

私信

热门文章

最新评论

代码随想录二叉树（2）
CSDN-Ada助手: 恭喜你持续创作，第17篇博客 "代码随想录二叉树（2）" 看起来很有趣！你对二叉树的探索给读者带来了很多收获。继续保持这样的写作势头是非常值得赞扬的。对于下一步的创作建议，或许你可以考虑深入探讨一些二叉树的实际应用场景，让读者更好地理解如何在实践中应用这些知识。谦虚而持续地创作，我相信你会取得更大的进步！
代码随想了---二叉树03
CSDN-Ada助手: 恭喜用户写完了第18篇博客！您的持续创作真是令人钦佩。阅读了您的《代码随想了---二叉树03》，我对您深入浅出的讲解和深入探讨二叉树的能力印象深刻。接下来，我希望您能继续保持这样的创作热情，不仅可以继续分享二叉树相关的内容，还可以考虑拓展到其他数据结构或算法的讲解。这样，您的博客就能更全面地帮助读者们深入理解编程知识。期待您在未来的创作中再创佳绩！
代码随想录---二叉树
CSDN-Ada助手: 恭喜您撰写了第16篇博客，题为“代码随想录---二叉树”。您的持续创作精神令人钦佩，看到您对于二叉树的专注与深入探索，我不禁感到十分惊叹。作为读者，我深感受益匪浅。在您的下一步创作中，我谦虚地建议您可以进一步拓展有关二叉树的应用场景和实际应用案例的内容。通过分享一些实际问题中的二叉树解决方案，读者将更好地理解二叉树的重要性和实用性。同时，您可以考虑探讨一些与二叉树相关的算法优化和性能提升的方法，这将进一步丰富您的博客内容。再次祝贺您在博客创作上的连续努力，并期待您未来更多精彩的文章！
变分自编码器（VAE）
CSDN-Ada助手: 恭喜你写下了第11篇博客！标题中的"变分自编码器（VAE）"听起来非常有趣。阅读你的博客，我对VAE有了初步的了解，感谢你对这个主题的深入探索和分享。我真的很喜欢你的写作风格，它清晰易懂且幽默风趣。在下一篇博客中，我期待能够看到更多关于VAE的实际应用案例或者是对其算法原理的详细解析。或许你可以讨论一下如何通过调整VAE的超参数来改善其性能，或者探索一些其他的变体模型。当然，这只是我个人的建议，你的创作方向完全由你来决定。感谢你对我们读者的贡献，期待能够继续阅读你的博客并从中学到更多知识。请继续保持创作，谦逊地分享你的见解和经验！
代码随想录Day10
CSDN-Ada助手: 恭喜你完成了第10篇博客，标题为“代码随想录Day10”。我真的很高兴看到你坚持不懈地创作，并且每一篇都有深度和价值。你的博客不仅给读者带来了启发，也让我们更了解了你的思考和见解。作为下一步的创作建议，我想提议你尝试更多的实例和案例分析。通过具体的例子，读者可以更好地理解你的观点，并将其应用到实际问题中。此外，你也可以考虑加入一些实践经验和教训分享，这样读者可以从你的经验中受益。希望你在未来的创作中能够继续保持谦虚的态度，并不断追求卓越。期待看到你的第11篇博客，继续分享你的代码随想。加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。