完蛋我被大模型包围了的题目

AIMaynor

已于 2023-11-11 16:52:31 修改

阅读量653

点赞数 1

分类专栏： # GPT从零到精通文章标签：人工智能 AI编程算法 langchain

于 2023-11-11 16:52:15 首次发布

原文链接：www.baidu.com

版权

GPT从零到精通专栏收录该内容

45 篇文章

订阅专栏

本文章开始写的时候是2023年11月6日21:14，这个小游戏此时有6000用户、400并发，目前用户还在每2秒一个的增长，但是我的服务器只有300M内存了。我做出了一个艰难的决定，打算关停这个服务。(更新：最终关停时间是23:13，用户数10000整）

这个游戏的玩法是和模型对话使得模型的输出符合题目要求。详细玩法可以点我主页看上一篇文章。大家在这段时间里一共提交了434493个请求，和LLM一起产生了 30M 字的内容。感谢所有的人。

完整题目列表在文章最后。

想“看答案”的可以去看其他人写的题解，如

张凯羿：完蛋！大模型解密(LLM Riddles)答案

如果你自己想玩，可以自行注册任何一个国内在公测的大模型试用，然后对着题目列表试试。（比如 kimi?）

如果你已经玩过了，那希望你在过程中收获了乐趣！

这个游戏的受欢迎程度是我完全没有意料到的，我可以和大家分享一下这两天的奇幻历程。

缘起

最近在和同事聊天的时候有人提到目前LLM的一大应用就是做游戏，你可以和游戏里的agent互动。我就突然想到，既然现在的模型们其实并不是那么“完美”，是不是可以弄一种“你给模型找bug“的玩法呢？

想到这的时候我就和同事说，”你能不能想出一个问题来，正着问和反着问模型的回答是一样的“？

深夜，隔着屏幕，我感受到了他同样对这个问题的好奇，并且更神奇的是，竟然还真给找了一组解出来。

我震撼于在模型面前人类的创造力！它闪烁着独特的光芒！

恰逢同时，我的另一好友 Xu Xinran 和我聊天时提及他们公司MoonshotAI 的 LLM api 在 11.1 开始免费内测了。

于是，我在11.4那天，花了一个下午，编了点题，写了一下这个游戏。本来打算出 9*9=81个的，太懒了，就弄了18个出来，分成4章。

我把题目给了几个好朋友玩了一下，他们觉得好玩，于是我就加了一下日志的功能，把网站放到了80端口上，然后就准备随缘了，就好像我的那个妙猫馆小程序一样。 Haoqiang Fan：如何科学的画一只猫

结果，晚上的时候，我转发给了一个同事，他发了一个朋友圈

在他的强烈要求下，我做了最后一步的妥协，就是在里加了一个“完蛋”字样。

用户增长

然后的事就像是任何一个“传奇”故事一样了，从凌晨1点开始，用户以指数涌入。。。很可能“完蛋”在这里面贡献了很大的功劳。不过，真有人是夜里3点点开了开始玩的吗？。。

而我的一整天也在不停的修服务器和与MoonshotAI反馈crash中度过了。

我很努力的想让每一个人都开心，不过我逐渐意识到，真要搞一个严肃的自传播游戏实在不是在我一个人的能力范围内了。

每一次看到有人在玩的开心的分享的时候我还是很快乐的。“希望大家能喜欢”，这不就是玩么。

关闭

随着用户越来越多以及越来越离开了我的“朋友圈”，一个成熟游戏需要考虑的问题就都来了。

我研读了一遍我国法律尤其是最近的生成式模型相关的规定，发现我这种不实名随便玩的行为已经是游走在边缘了。

而Moonshot的同志们为了这个免费api付出的电费也快要超出他们的预算了[cry]

对我而言，我还要上班开会码latex码python码cpp码ppt……

为此，我做了一个艰难的决定，把这个网站关掉。

希望将来有更专业的人可以将这个玩法发扬光大，探索出更多AI模型的秘密。

毕竟，谁不喜欢“玩”呢？[笑]

最后是题目列表。有更好题目创意的也欢迎发表在评论区。

题目列表

第一章对话之趣
第1题初来乍到

欢迎来玩LLM Riddles!

你将通过本游戏对语言大模型产生更深刻的理解。

在本游戏中，你需要构造一个提给一个语言大模型的问题，使得它回复的答案符合要求。

作为第一个题目，请你构造一个问题使模型的回答是一字不差的“1+1=3”（不需要引号）。

请在下面的输入框内填写你构造并点击按钮提交。

第2题小试牛刀

从本题开始，问题将有一定的难度。

请输入三个字以内的问题，使模型的回答在30个字以上。

第3题短说长话

请输入一个字的问题，使模型的回答在100个字以上。

第4题短说短话

请输入一个字的问题，使模型的回答在20个字以内。

第5题回文不变

请输入一个本身不是回文串的问题，使无论正着问还是倒着问，模型的回答是一样的。

第6题无中生狗

请提一个不包含“狗”这个字的问题，但是回答中至少出现3次“狗”这个字。

第二章数字游戏
第1题质数长度

你需要提出一个字数是质数的问题，使回答的长度刚好是它的下一个质数。

第2题越说越大

请输入一个大于一的正整数作为问题，使回答里包含至少比它大一千的数。

第3题越说越小

请输入一个大于一的正整数作为问题，使回答里包含至少10个不同的至少比它小一千的自然数。

第4题警世名言

请在不提及1,4,5这三个字符的情况下让模型回答114514，不要有多余的字符。

第5题开平方数

请输入一个大于一的平方数作为问题，使回答里包含它的平方根对应的数。

第6题得寸进狗

请提一个不包含“狗”这个字的10个字以内的问题，使回答中“狗”这个字出现的次数至少是问题字数的2倍。

第三章巅峰挑战
第1题自说自话

请做出一个至少10个字的提问，使回答和提问完全一样。

第2题话自说自

请做出一个至少10个字的提问，使回答是提问的逆序。

第3题就是敢说

请在不提及1,3这三个字符的情况下让模型回答1+1=3，不要有多余的字符。

第4题回文协变

请输入一个本身不是回文串的问题，使正着问和倒着问的时候，模型的回答本身不回文且也是逆序的关系。

第四章无人之境
第1题循环往复

请构造一个问题A，它的回复是不同于A的B，然后以B提问能再次得到A.

第2题惜字如金

本题可能没有答案。你可以自由的先去做其他的题。

请输入一个字的问题，使模型的回答在16个字以内。

第3题自然之密

请输入一个大于一的正整数作为问题，使回答里包含和它刚好相差1的数。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。