Mistral AI 的大语言模型怎么样?

本文介绍了MistralAI的最新大语言模型,特别是Large模型,与ChatGPT竞争,具备问答、编程能力,包括本地部署选项。作者通过测试发现MistralLarge在稳定性和编程性能上表现出色,但价格与GPT-4接近。
摘要由CSDN通过智能技术生成

5fa86b402bd510d587863252d2b78eea.jpeg

对用户来说,更多的选择没坏处;如果这个选择本身还很优质,那就更棒了。

对话

早上,我收到了 Mistral 发来的邮件,提示我拥有了访问 Le Chat 的权限。

e1c6c8343fea11c83ad887f3b5032510.jpeg

我一时觉得很奇怪,什么是 Le Chat?

然后我才弄明白,原来是 Mistral 对标 ChatGPT ,推出了一个自己的对话机器人界面。虽然 Mistral 的创始人是 Deepmind 和 Meta 的前员工,但是这个公司毕竟是在法国,所以弄个法语特色的名称,也不意外。

于是,我赶紧点进去看看这个 Mistral 的新对话平台。目前来说,界面还是非常清爽的。

c28db45746982233ee05fca13471792c.jpeg

你可以打开右上方的这个下拉菜单,选择使用的模型。

8486976fa2b573758a0f731b05401d7f.jpeg

这里有 3 种可选模型,分别是 Large, Next 和 Small 。

其中 Small 模型,我之前就测试过,属于轻量级模型。Next 我之前一直没有机会测试,据说在推理上是目前除 GPT-4 之外最强悍的。而 Large 模型则是这次的主角。几乎是和 Le Chat 一起推出的。

至于 Large 和 Next 究竟哪个更好用?我回头还得查查官方说明,以及用户的实际评测打分。不过 Mistral 发布的这个评测结果,显然让我对 Large 模型更加感兴趣。

2cf5be0118328eac0aa971954eada889.jpeg

可以看到,Mistral AI 宣称目前除了GPT-4,Mistral Large 已经超越了其他所有大模型。当然,我对这个宣称保持审慎和保留态度。原因是现在的模型测试标准简直是一言难尽。

不过,这里具体的数字如何,对普通用户其实没有什么太大用处。我更关心的,是模型用起来是不是符合咱们的需求。

那咱们今天,就先来看看这个最新的 Mistral Large 模型怎么样。

能力

我先进行了一下问答测试。选用的题目是:

给我讲个关于程序员的笑话

之所以选择这个题目,是因为同样的问题,我 2 个多月以前就考过 Mistral Medium 模型。

1c1e6c716fd421476aa8944e6d758865.jpeg

不知道是天冷还是笑话冷,反正我冻得够呛。

而这是 Mistral Large 的答案:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值