Mistral Large 2 震撼发布：性能全面超越，精准狙击Llama 3.1

最新推荐文章于 2024-10-08 14:58:59 发布

OpenCSG

最新推荐文章于 2024-10-08 14:58:59 发布

阅读量524

点赞数 21

文章标签： llama 人工智能

本文链接：https://blog.csdn.net/OpenCSG/article/details/140773899

版权

前沿科技速递🚀

Mistral AI重磅推出最新开源模型Mistral Large 2，这款旗舰模型在性能、成本效益和多语言支持方面全面超越Llama 3.1。Mistral Large 2拥有1230亿参数，尽管参数量仅为Llama 3.1的三分之一，但在MMLU基准测试中表现优异，预训练版本达到84.0%的准确率。经过大量代码数据训练，Mistral Large 2在代码生成和推理能力上也达到了与GPT-4o、Claude 3 Opus和Llama 3 405B等领先模型相媲美的水平，为开发者和研究人员提供了强大而高效的工具。

来源：传神社区

01 全面升级的性能与成本效率

Mistral Large 2延续了Mistral AI的优良传统，在成本效益、速度和性能方面取得显著进步。尽管参数量仅为123B，但在多个评估指标上表现优异。特别是在MMLU基准测试中，预训练版本达到了84.0%的准确率。这一成绩已经超过了340B参数的Nemotron，并与GPT-4（85.1%）和Llama 3.1（87.3%）基本处于同一水平。

02 代码生成与推理能力：减少“幻觉”，追求准确性

基于在Codestral 22B和Codestral Mamba上的丰富经验，Mistral AI在大量代码数据上对Mistral Large 2进行了训练。Mistral Large 2的性能远超之前的Mistral Large，与GPT-4o、Claude 3 Opus和Llama 3 405B等领先模型不相上下。此外，Mistral AI还投入了大量精力来增强模型的推理能力。训练期间的一个关键重点是尽量减少模型产生“幻觉”或生成听起来合理但实际上不正确或不相关的信息的倾向。通过微调模型，使其在响应中更加谨慎和敏锐，从而确保提供可靠和准确的输出。

新的 Mistral Large 2 经过训练，可以在找不到解决方案或没有足够信息来提供自信答案时进行确认。这种对准确性的承诺反映在模型在主流数学基准测试中的改进表现，展示了其增强的推理和解决问题的能力：