万事开头难? 喵小DI玩“羊了个羊”可不难

喵小DI介绍了如何使用DI-sheep,一个基于深度强化学习的《羊了个羊》解决方案。DI-sheep提供三种玩法:AI指路、故意唱反调和合作愉快。通过状态编码、表征学习和强化学习,DI-sheep能帮助玩家顺利游戏。项目开源在GitHub,并将陆续推出更多玩法和原理解析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hello,大家好呀,喵小DI又来了~最近大家是不是都在玩《羊了个羊》?

喵小DI也尝试了下,本来想着凭借本喵超高的智商,过第二关简直易如反掌,结果还是,惨败:(
 

喵小DI又尝试了N+1下,本来想着再凭借本喵超高的智商,过第二关还不易如反掌,结果还是,惨败:(

本喵只是运气不好而已,哼!

是时候秀一秀本喵的智商了!

本喵知道有很多朋友正在经历:

吃饭在打 

带薪蹲坑在打 

睡前在打 

梦里都在打 

......

但就是过不去第二关是怎么肥事 

所以本喵和 OpenDILab 的小伙伴们连夜打造了DI-sheep,尝试用深度强化学习来玩这个游戏。

欢迎大家体验DI-sheep:

https://github.com/opendilab/DI-sheep

滑到文章最后有彩蛋哦

千人千面的DI-sheep

这里给大家介绍下 DI-sheep 的几种特色玩法,大家可以去 repo 里尝试下。

(请注意,试玩 DI-sheep AI 是需要自己部署开源代码哦,后续我们会搭建 AI 助力版在线网页小游戏,敬请期待)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值