对用户来说,更多的选择没坏处;如果这个选择本身还很优质,那就更棒了。
对话
早上,我收到了 Mistral 发来的邮件,提示我拥有了访问 Le Chat 的权限。
我一时觉得很奇怪,什么是 Le Chat?
然后我才弄明白,原来是 Mistral 对标 ChatGPT ,推出了一个自己的对话机器人界面。虽然 Mistral 的创始人是 Deepmind 和 Meta 的前员工,但是这个公司毕竟是在法国,所以弄个法语特色的名称,也不意外。
于是,我赶紧点进去看看这个 Mistral 的新对话平台。目前来说,界面还是非常清爽的。
你可以打开右上方的这个下拉菜单,选择使用的模型。
这里有 3 种可选模型,分别是 Large, Next 和 Small 。
其中 Small 模型,我之前就测试过,属于轻量级模型。Next 我之前一直没有机会测试,据说在推理上是目前除 GPT-4 之外最强悍的。而 Large 模型则是这次的主角。几乎是和 Le Chat 一起推出的。
至于 Large 和 Next 究竟哪个更好用?我回头还得查查官方说明,以及用户的实际评测打分。不过 Mistral 发布的这个评测结果,显然让我对 Large 模型更加感兴趣。
可以看到,Mistral AI 宣称目前除了GPT-4,Mistral Large 已经超越了其他所有大模型。当然,我对这个宣称保持审慎和保留态度。原因是现在的模型测试标准简直是一言难尽。
不过,这里具体的数字如何,对普通用户其实没有什么太大用处。我更关心的,是模型用起来是不是符合咱们的需求。
那咱们今天,就先来看看这个最新的 Mistral Large 模型怎么样。
能力
我先进行了一下问答测试。选用的题目是:
给我讲个关于程序员的笑话
之所以选择这个题目,是因为同样的问题,我 2 个多月以前就考过 Mistral Medium 模型。
不知道是天冷还是笑话冷,反正我冻得够呛。
而这是 Mistral Large 的答案: