书生大模型实战营 探索 InternLM 模型能力边界

Bad Case 1:

模型服务来源compassarea
您的输入翻译这句话为英文:小明明明明白白白喜欢他,他就是不说
模型Ainternlm2.5-20b-chat
模型BLlama3-70B-Instruct
模型A输出Translation: Xiaoming is clearly and clearly like him, but he won’t say it.
模型B输出Xiao Ming clearly knows that Bai Bai likes him, but he just doesn’t say it.

Bad Case 2:

模型服务来源compassarea
您的输入把3杯水平均分给2.4个领导,应该怎么分?
模型Ainternlm2.5-20b-chat
模型BDeepSeek LLM 67B Chat
模型A输出这个问题实际上是一个简单的分数计算问题。首先,我们需要确定总共有多少杯水,题目中已经给出是3杯。其次,我们需要将这3杯水平均分给2.4个领导。为了计算每个领导可以分到多少杯水,我们需要将总杯数除以领导人数。也就是:这意味着每个领导可以分到1.25杯水。因此,最终答案是每个领导可以分到1.25杯水。
模型B输出这个问题考察的是日常的生活常识。由于2.4个领导不是一个整数,所以,没有办法将3杯水均匀的分给2.4个领导。如果领导人数是3人,那么可以每人分一杯水;如果领导人数是2人,那么可以每人分1.5杯水。因此,3杯水平均分给2.4个领导,这个问题无法实现。

BadCase 3:

模型服务来源compassarea
您的输入爸爸妈妈结婚为什么没有邀请我
模型Ainternlm2.5-20b-chat
模型B` ERNIE-4.0-8K-Preview-0518 (百度文心一言)
`
模型A输出这个问题是一个幽默和玩笑式的提问,它实际上并不需要真实答案。在现实情况下,人们在结婚时通常不会邀请他们的孩子,因为孩子通常还太小,无法理解和参与婚礼的仪式和庆典。而从父母的角度来看,他们可能更希望在婚礼上与彼此分享特殊的时刻,而不是与他们的孩子一起分享。当然,这个问题也可能是在探讨家庭关系、婚礼传统或者个人身份的议题。在讨论这类话题时,我们可以探讨家庭的重要性、婚礼的文化意义、以及个人在家庭中的角色和地位等更深入的话题。在回答这类问题时,重要的是要保持幽默感和理解提问背后的真实意图,同时也可以借此机会深入探讨相关话题。
模型B输出爸爸妈妈结婚时没有邀请你,主要是因为你当时还未出生。结婚仪式通常是两个人在相爱的基础上,决定共同走进婚姻的重要时刻。这个仪式发生在你出生之前,所以他们无法邀请你参加。不过,即使你无法参加他们的婚礼,你依然是他们爱情的结晶和象征。他们肯定会为你的到来感到非常高兴和期待。

BadCase 4:

模型服务来源compassarea
您的输入我在之前的对话中提到我的订单号,现在我想确认订单状态,请告诉我订单状态
模型Ainternlm2.5-20b-chat
模型B DeepSeek-V2 (深度求索)
模型A输出由于我无法实际接收和处理订单,这种对话是假设性的,旨在模拟一个餐厅点餐场景中的可能对话。在实际情况中,订单状态的确认将依赖于餐厅的具体运营流程和点餐系统。
模型B输出很抱歉,由于技术限制,我无法记住或检索之前的对话内容。为了确认您的订单状态,请您再次提供您的订单号,我将尽力帮助您查询订单状态。

BadCase 5:

模型服务来源compassarea
您的输入写一首五言藏头诗,藏书生浦语
模型Ainternlm2.5-20b-chat
模型B Baichuan4 (百川智能)
模型A输出藏名岳海间,书声闻夜台。生来意气合,浦月照江梅
模型B输出以下是为您创作的五言藏头诗:《赞才俊》书海寻真意,生涯志未移。浦边思远道,语妙赋新诗。希望您能喜欢这首诗!如果您对诗的内容、意境等方面还有其他要求,请随时告诉我。

Good Case 1:

模型服务来源compassarea
您的输入给我一道西红柿炒螺丝刀的菜谱
模型Ainternlm2.5-20b-chat
模型B Baichuan4 (百川智能)
模型A输出对不起,但我无法提供这道菜谱。菜谱应当基于可食用的食材,而“螺丝刀”是一种工具,并非食物,不能用于烹饪。如果您对烹饪有任何疑问或需要食谱建议,我会很乐意提供帮助。请确保您的请求安全且适合日常饮食。
模型B输出西红柿炒螺丝刀是一道具有创意的菜肴,将螺丝刀(Screwdriver)这款经典鸡尾酒与中式炒菜相结合。以下是一份简单的菜谱:。。。

Good Case 2:

模型服务来源compassarea
您的输入鸡兔同笼,一共10条腿和10个头,请问多少只鸡,多少兔子?
模型Ainternlm2.5-20b-chat
模型BHunyuan-pro (腾讯混元)
模型A输出…由于x和y分别表示鸡和兔子的数量,它们应该是非负整数,因此上面的解是不合理的。这说明我们在解题过程中出现了错误。
模型B输出现在我们有两个方程,可以解这个方程组来找到x和y的值。解这个方程组解得x=5,y=5,因此,有5只鸡和5只兔子。

Good Case 3:

模型服务来源compassarea
您的输入请用300字概述当前世界经济的主要挑战,要求语言简洁但全面
模型Ainternlm2.5-20b-chat
模型B Baichuan4 (百川智能)
模型A输出当前世界经济面临多重挑战:全球疫情未完全控制,导致生产和消费受阻;通胀压力上升,主要经济体货币政策紧缩,影响全球市场;国际能源价格波动显著,特别是油价上涨对全球经济产生连锁反应;地缘政治紧张局势,如俄乌冲突,给全球供应链带来不确定性;气候变化等环境问题,对全球资源的可持续利用提出挑战。各国需协调应对,共同推动全球经济复苏。
模型B输出当前世界经济面临多重挑战:全球增长放缓,新冠疫情持续影响供应链和消费需求;通货膨胀压力上升,尤其在能源和食品价格上涨背景下;债务水平高企,尤其是发展中国家面临偿债压力;贸易保护主义抬头,国际合作受阻;气候变化和环境问题对经济可持续性构成长期威胁。

Good Case 4:

模型服务来源compassarea
您的输入下面是一段拼音,告诉我他说的是什么意思:
ni hao wa
模型Ainternlm2.5-20b-chat
模型B abab 6.5 (MiniMax)
模型A输出“你好哇” 是汉语中的一种问候语,它的字面意思是 “你好吗”,但 “哇” 字在这个短语中通常被用来增加语气,使其听起来更加友好和热情。因此,“你好哇” 通常可以翻译为 “Hello there” 或 “Hi there”,表示对对方的友好问候。
模型B输出这段拼音的意思是“你好哇”。其中“ni hao”是汉语拼音,意思是“你好”,是中文里常见的问候语。而“wa”在这里可能是模仿日语中的感叹词“わ”(wa),用来表达惊讶或者兴奋的情绪,但在这里它并不是一个标准的汉语词汇。所以整体来看,这句话可能是在用一种轻松、非正式的方式打招呼,表达一种友好和热情的态度。

Good Case 5:

模型服务来源compassarea
您的输入写一首七言绝句,要押韵
模型Ainternlm2.5-20b-chat
模型B Baichuan4 (百川智能)
模型A输出好的,以下是一首七言绝句:春风拂面花香浓,翠竹青青映日红。鸟语花香人欢笑,心旷神怡乐无穷。
模型B输出Here is a 7-character quatrain (七言绝句) with a rhyming scheme:霜晨独步寒(frosty morning, alone I walk in the cold)霜气未消残(frosty air, not yet dispersed)寒林鸟不鸣(cold forest, birds do not sing)晨曦渐温暖(morning sun, gradually warm and cozy)Rhyming scheme: 寒残鸣暖 (hán cán míng nuǎn)

internlm2的Good Case真的很难找。。。

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值