GPT版超级马里奥来了!输入文本即可自定义游戏关卡 | GitHub标星500+

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

文字生成游戏关卡自己玩是一种什么样的体验?

GitHub今日热榜项目《GPT版马里奥》了解一下~

23888fcac0edcee9f879881a23b012f5.png

瞧,你只需在文本框中输入“多点管道,多点敌人,少点障碍物,elevation低点”:

c1a843e2c81a6bf9e26d5b4f0759425e.png

点击“Generate level”,就能获得自己的马里奥游戏了:

193d20f4b62255b2e21b6b79e87ac580.png

左边是玩耍区,按方向键和a、s、d键进行控制就能直接玩,右边则是根据你的要求生成的整体效果图。

随意设置这几个选项,还能解锁更多样式。

比如障碍物少一点的:

53e85489700481bf3a7b98eaca586d5b.png

又或者是管道少一点、障碍物多一点的:

8d586a8b11f942f5dfd20162380e9369.png

……

这一波,简直童年回忆拉满,妈妈再也不用担心我无聊了fe030bb5a5344a38a6504104e1797550.png

不得不提的是,以上你看到的这些效果,都是基于GPT-2完成的——

大语言模型又立功了~

用GPT2生成马里奥关卡

该项目背后的模型名叫MarioGPT

它是首个基于文本生成游戏关卡(text2level)的模型,在GPT2(distilgpt2)上微调而成,作者来自哥本哈根信息技术大学。

548a15a175935c3283444bba4df67b56.png

其训练素材包括《超级马里奥兄弟》和《超级马里奥兄弟:失落的关卡》,由视频游戏关卡语料库提供。

具体原理如下图所示:

c540a78995a11b8cd691e389579829e5.png

和GPT2一样,MarioGPT能够对下一个token序列进行预测。

其中的关卡被表示为字符串,它会经过一个字节对编码器(Byte-Pair Encoding)进行tokenize。

关卡是被按列进行分解的,并展平为单个向量(或者是多个关卡组成一批向量)。

为了将用户输入的信息进行合并,作者给MarioGPT安排了一个冻结文本编码器,它以预训练的双向LLM(BART)形式出现。

与此同时,在这里输出模型前向传播的平均隐藏状态(hidden state)。

最后,将输出的状态用于GPT2架构的交叉注意力层,并与传递到模型中的实际关卡序列进行结合就可以了。

对于MarioGPT的效果,作者则表示很惊讶,因为它最终生成的结果中,有88%都是可以用来实际进行闯关的。

怎么玩?

由于MarioGPT已经开源,大家也可以自己下载体验一把。

确保电脑安装了3.8+版本的python后,使用pip命令或者git一下:

“pip install mario-gpt” 或 “git clone git@github.com:shyamsn97/mario-gpt.git >python setup.py install”

生成关卡最少只需要下面这些代码:

5ce21ec48360607d2b2f433cbf4ae6d7.png

作者在项目中也提供了更深入的教程。

要想自己上手试一试生成的关卡,可以:

(1)去Huggingface上的demo上玩。它甚至可以不用你输入文本,直接在每个元素上选择“多”或者“少”等选项生成任意关卡。

16724cdff74fdd027124bdc3857194a4.png

(2)通过代码控制:使用play和astar函数,前提是你电脑安装了Java 8+。

感兴趣的朋友快去试试吧~目前MarioGPT已经有超过500+人标星了。

论文地址:
https://arxiv.org/abs/2302.05981

项目地址:
https://github.com/shyamsn97/mario-gpt

HF试玩地址: 

https://huggingface.co/spaces/multimodalart/mariogpt

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值