现在可用的免费的AI达到什么水平,我们用一道小学六年级的题来测试一下,
测试了主流的:文心一言、Kimi、DeepSeek、GPT-4o、Claude-3.5-sonne、豆包
但很有意思的是,它们的解答思路结果都跟小孩子的答案不一样!也没理解我说的小学6年级这一关键词,小学没有勾股定理.
结论让我感到有点开心,至少AI离AI还有一段路要走...
提示词语都是,上传图片,加文字: 解答一下,这是小学6年级的题目:
感兴趣的可以认真看看,你的答案是多少:
Kimi:
豆包:
GPT-4o:
Claude-3.5-sonnet :
DeepSeek:
文心一言3.5: