Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿...

QbitAl

于 2024-09-12 11:46:41 发布

阅读量6

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247748668&idx=3&sn=61103a572c093b42f4da7386079bf374&chksm=e9faed3ed8209a8aabe6ca7a2bcdad337a411b60cab91b6cccde6b7b6929ad031b3fe3dd4071&scene=126&sessionid=0

版权

明敏发自凹非寺
量子位 | 公众号 QbitAI

Mistral的多模态大模型来了！

Pixtral 12B正式发布，同时具备语言和视觉处理能力。

它建立在文本模型Nemo 12B基础上，包含一个专门的视觉编码器。

大概24GB，原生支持任意数量和尺寸的图像，大约有40层神经网络、14,336 个隐藏维度大小和32个注意力头，以及一个专用的视觉编码器，支持高分辨率图像（1024×1024）处理。

发布形式还是简单直接一个种子链接。

现在可以通过链接、GitHub或Hugging Face下载模型。

Mistral的开发主管表示，后续也会在Chatbot上接入模型，并提供API服务。

超越Qwen、LLaVA等

虽然目前模型的训练数据、细节都未公开，但是通过模型代码网友们发现了更多细节。

1、先进架构：40层网络、14336隐藏维度大小、32个注意力头。

2、视觉能力：专用视觉编码器，支持1024x1024图像大小和24个隐藏层，用于高级图像处理。

3、更大词汇量：131072tokens，支持更细致语言理解和生成。

4、使用GeLU(用于视觉适配器)和2D RoPE(用于视觉编码器)。

5、Patch大小：16×16像素。

6、在mistral_common中支持tokenizer。

7、模型权重bf16。

与此同时，还有人在放出了Mistral发布会上公布的模型基准情况。

Pixtral 12B和Qwen2-VL-7B、LLaVA-OV-7B、Phi-3 Vision做了对比。

多模态知识和推理、QA等方面都表现不错。

欧洲版OpenAI估值达60亿美元

最近几个月Mistral的动作还是非常密集的。

今年6月，他们通过股权债务融资完成约6.4亿美元B轮融资。估值已达60亿美元（折合人民币约420亿）。

完成融资后，他们便发布了Mistral Large 2旗舰模型、SMoE模型Mistral 8×22B以及开源模型Codestral等。

目前，微软、AWS、Snowflake等巨头均投资Mistral。尤其是微软的入股，使得Mistral成为OpenAI以外，微软Azure第二个商业闭源模型供应商。这也进一步夯实了Mistral“欧洲版OpenAI”的地位。

参考链接：
[1]https://x.com/_philschmid/status/1833954941624615151
[2]https://venturebeat.com/ai/pixtral-12b-is-here-mistral-releases-its-first-ever-multimodal-ai-model/
[3]https://x.com/theresanaiforit/status/1833784474342977627

— 完 —

量子位年度AI主题策划正在征集中！

欢迎投稿专题 一千零一个AI应用，365行AI落地方案

或与我们分享你在寻找的AI产品，或发现的AI新动向

点这里👇关注我，记得标星哦～

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿...

明敏发自凹非寺量子位 | 公众号 QbitAIMistral的多模态大模型来了！Pixtral 12B正式发布，同时具备语言和视觉处理能力。它建立在文本模型Nemo 12B基础上，包含一个专门的视觉编码器。大概24GB，原生支持任意数量和尺寸的图像，大约有40层神经网络、14,336 个隐藏维度大小和32个注意力头，以及一个专用的视觉编码器，支持高分辨率图像（1024×1024）处理。发布形式...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。