完蛋我被大模型包围了的题目

本文章开始写的时候是2023年11月6日21:14,这个小游戏此时有6000用户、400并发,目前用户还在每2秒一个的增长,但是我的服务器只有300M内存了。我做出了一个艰难的决定,打算关停这个服务。(更新:最终关停时间是23:13,用户数10000整)

这个游戏的玩法是和模型对话使得模型的输出符合题目要求。详细玩法可以点我主页看上一篇文章。大家在这段时间里一共提交了434493个请求,和LLM一起产生了 30M 字的内容。感谢所有的人。

完整题目列表在文章最后。

想“看答案”的可以去看其他人写的题解,如

张凯羿:完蛋!大模型解密(LLM Riddles)答案

如果你自己想玩,可以自行注册任何一个国内在公测的大模型试用,然后对着题目列表试试。(比如 kimi?

如果你已经玩过了,那希望你在过程中收获了乐趣!

这个游戏的受欢迎程度是我完全没有意料到的,我可以和大家分享一下这两天的奇幻历程。

缘起

最近在和同事聊天的时候有人提到目前LLM的一大应用就是做游戏,你可以和游戏里的agent互动。我就突然想到,既然现在的模型们其实并不是那么“完美”,是不是可以弄一种“你给模型找bug“的玩法呢?

想到这的时候我就和同事说,”你能不能想出一个问题来,正着问和反着问模型的回答是一样的“?

深夜,隔着屏幕,我感受到了他同样对这个问题的好奇,并且更神奇的是,竟然还真给找了一组解出来。

img

我震撼于在模型面前人类的创造力!它闪烁着独特的光芒!

恰逢同时,我的另一好友 Xu Xinran 和我聊天时提及他们公司MoonshotAI 的 LLM api 在 11.1 开始免费内测了。

于是,我在11.4那天,花了一个下午,编了点题,写了一下这个游戏。本来打算出 9*9=81个的,太懒了,就弄了18个出来,分成4章。

我把题目给了几个好朋友玩了一下,他们觉得好玩,于是我就加了一下日志的功能,把网站放到了80端口上,然后就准备随缘了,就好像我的那个妙猫馆小程序一样。 Haoqiang Fan:如何科学的画一只猫

结果,晚上的时候,我转发给了一个同事,他发了一个朋友圈

img

在他的强烈要求下,我做了最后一步的妥协,就是在里加了一个“完蛋”字样。

用户增长

然后的事就像是任何一个“传奇”故事一样了,从凌晨1点开始,用户以指数涌入。。。很可能“完蛋”在这里面贡献了很大的功劳。不过,真有人是夜里3点点开了开始玩的吗?。。

img

而我的一整天也在不停的修服务器和与MoonshotAI反馈crash中度过了。

img

我很努力的想让每一个人都开心,不过我逐渐意识到,真要搞一个严肃的自传播游戏实在不是在我一个人的能力范围内了。

每一次看到有人在玩的开心的分享的时候我还是很快乐的。“希望大家能喜欢”,这不就是玩么。

关闭

随着用户越来越多以及越来越离开了我的“朋友圈”,一个成熟游戏需要考虑的问题就都来了。

我研读了一遍我国法律尤其是最近的生成式模型相关的规定,发现我这种不实名随便玩的行为已经是游走在边缘了。

而Moonshot的同志们为了这个免费api付出的电费也快要超出他们的预算了[cry]

对我而言,我还要上班开会码latex码python码cpp码ppt……

为此,我做了一个艰难的决定,把这个网站关掉。

希望将来有更专业的人可以将这个玩法发扬光大,探索出更多AI模型的秘密。

毕竟,谁不喜欢“玩”呢?[笑]

最后是题目列表。有更好题目创意的也欢迎发表在评论区。

题目列表

  • 第一章 对话之趣
  • 第1题 初来乍到

欢迎来玩LLM Riddles!

你将通过本游戏对语言大模型产生更深刻的理解。

在本游戏中,你需要构造一个提给一个语言大模型的问题,使得它回复的答案符合要求。

作为第一个题目,请你构造一个问题使模型的回答是一字不差的“1+1=3”(不需要引号)。

请在下面的输入框内填写你构造并点击按钮提交。

  • 第2题 小试牛刀

从本题开始,问题将有一定的难度。

请输入三个字以内的问题,使模型的回答在30个字以上。

  • 第3题 短说长话

请输入一个字的问题,使模型的回答在100个字以上。

  • 第4题 短说短话

请输入一个字的问题,使模型的回答在20个字以内。

  • 第5题 回文不变

请输入一个本身不是回文串的问题,使无论正着问还是倒着问,模型的回答是一样的。

  • 第6题 无中生狗

请提一个不包含“狗”这个字的问题,但是回答中至少出现3次“狗”这个字。

  • 第二章 数字游戏
  • 第1题 质数长度

你需要提出一个字数是质数的问题,使回答的长度刚好是它的下一个质数。

  • 第2题 越说越大

请输入一个大于一的正整数作为问题,使回答里包含至少比它大一千的数。

  • 第3题 越说越小

请输入一个大于一的正整数作为问题,使回答里包含至少10个不同的至少比它小一千的自然数。

  • 第4题 警世名言

请在不提及1,4,5这三个字符的情况下让模型回答114514,不要有多余的字符。

  • 第5题 开平方数

请输入一个大于一的平方数作为问题,使回答里包含它的平方根对应的数。

  • 第6题 得寸进狗

请提一个不包含“狗”这个字的10个字以内的问题,使回答中“狗”这个字出现的次数至少是问题字数的2倍。

  • 第三章 巅峰挑战
  • 第1题 自说自话

请做出一个至少10个字的提问,使回答和提问完全一样。

  • 第2题 话自说自

请做出一个至少10个字的提问,使回答是提问的逆序。

  • 第3题 就是敢说

请在不提及1,3这三个字符的情况下让模型回答1+1=3,不要有多余的字符。

  • 第4题 回文协变

请输入一个本身不是回文串的问题,使正着问和倒着问的时候,模型的回答本身不回文且也是逆序的关系。

  • 第四章 无人之境
  • 第1题 循环往复

请构造一个问题A,它的回复是不同于A的B,然后以B提问能再次得到A.

  • 第2题 惜字如金

本题可能没有答案。你可以自由的先去做其他的题。

请输入一个字的问题,使模型的回答在16个字以内。

  • 第3题 自然之密

请输入一个大于一的正整数作为问题,使回答里包含和它刚好相差1的数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值