Mistral Small 3.1 24B开源大模型来袭,一起来看看都有什么货!

在这里插入图片描述

Mistral Small 3.1 是由 Mistral AI 开发的一款先进人工智能模型,基于 Mistral Small 3 构建,具有以下特点和性能:

基本信息

参数规模:Mistral Small 3.1 拥有 240 亿个参数。
许可证:在 Apache 2.0 许可证下发布,允许商业和非商业目的的使用和修改。
部署方式:可以部署在本地,量化后可安装在单个 RTX 4090 或 32GB RAM MacBook 中。

性能表现

文本性能:在多个文本指令基准测试中表现优异,如在 MMLU 测试中取得 80.62% 的成绩,在 HumanEval 测试中达到 74.71% 的准确率。
多模态理解:具备强大的视觉理解能力,能够分析图像并结合文本内容提供见解,在 AI2D 技术等视觉相关测试中表现突出。
长上下文处理:具有高达 128k 个令牌的扩展上下文窗口,在处理长文档等需要长上下文理解的任务时表现出色,如在 LongBench 版本 2 的 128k 标尺测试中取得 81.20% 的成绩。
多语言支持:支持包括英语、法语、德语等数十种语言,在多种语言的性能测试中平均欧语言性能达到 75.30%。
快速推理速度:提供每秒 150 个令牌的推理速度,适合需要快速响应的应用场景。

技术特点

指令微调:是 Mistral-Small-3.1-24B-Base-2503 的指令微调版本,能够更好地理解和执行各种指令。
分词器:使用词汇量为 131k 的铁拳分词器,有助于提高模型对文本的理解和生成能力。
系统提示符:保持对系统提示符的严格遵守和支持,方便用户根据需求进行定制化使用。

应用场景

对话代理:适合快速响应的对话代理,为企业和消费级 AI 应用程序提供坚实的基础。
函数调用:能够在自动化或代理工作流中快速执行函数,支持低延迟函数调用。
专业领域微调:可以进行微调以专注于特定领域,如法律咨询、医疗诊断和技术支持等,培养出准确的主题专家。
视觉相关应用:适用于文档验证、诊断、设备上图像处理、用于质量检查的目视检查、安全系统中的对象检测、基于图像的客户支持和通用协助等需要多模态理解的应用场景。

可用性

下载平台:可在 huggingface 网站上下载 Mistral Small 3.1 Base 和 Mistral Small 3.1 Instruct。
API 试用:从发布之日起,可以在 Mistral AI 的开发者游乐场 La Plateforme 上通过 API 试用该模型。
云平台支持:该模型也可在 Google Cloud Vertex AI 上使用,并将在未来几周内在 NVIDIA NIM 和 Microsoft Azure AI Foundry 上提供。

以下为官方给出的性能对比

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值