微软发布「轻量级AI模型」Phi-3-mini，性能逼近GPT-3.5，可手机端运行

快乐小码农

已于 2024-04-26 14:42:36 修改

阅读量1.6k

点赞数 19

分类专栏： AI 开源大模型多模态大模型文章标签： SLM 轻量级AI模型开源AI模型 Phi-3

于 2024-04-26 14:32:47 首次发布

本文链接：https://blog.csdn.net/u012744245/article/details/138218010

版权

AI 同时被 3 个专栏收录

59 篇文章

订阅专栏

开源大模型

57 篇文章

订阅专栏

多模态大模型

35 篇文章

订阅专栏

微软发布「轻量级AI模型」Phi-3-mini，性能逼近GPT-3.5，可手机端运行

小模型时代来了？

当地时间 4 月 23 日，微软发布了 Phi-3 系列模型，最小参数38亿，最大规模拓展到了140亿，包含3个版本，分别是Phi-3-mini-3.8B、Phi-3-small-7B 和 Phi-3-medium-14B。

在这里插入图片描述

Phi-3-mini-3.8B 是一个基于 3.3 万亿个 token 训练的 38 亿参数语言模型，在语言、推理、编码和数学基准测试中超越了众多数百亿参数规模的模型。

根据基准测试结果，Phi-3-mini 整体性能可与 Mixtral 8x7B 和 GPT-3.5 等模型相媲美，例如，Phi-3-mini 在 MMLU 上的得分率为 69%，在 MT-bench 上的得分率为 8.38。

Phi-3-mini 有4k和128k tokens两个上下文长度变体，经过预训练和指令调整，可以更好地理解人类的语言、表达、逻辑并执行不同类型的指令。

与大语言模型相比，Phi-3-mini 模型操作更为简便。该模型的体积很小，可以部署在手机上。据称，该模型可以作为聊天机器人离线访问，且具有不亚于GPT-3.5的性能。

现已在 Azure、Hugging Face 和 Ollama 上可使用。

在这里插入图片描述

图注：Phi-3-mini 与 Phi-2 、Mistral-7b-v0.1、Mixtral-8x7B、Gemma 7B、Llama-3-instruct8B 和 GPT-3.5 的比较结果

Phi-3-mini 模型虽然通过优质数据在语言理解和推理能力上媲美更大参数的 AI 模型，但在 TriviaQA 等某些任务上依然受到模型规模的限制。

Phi-3-small-7B 是新增的一个更大规模参数版本的Phi模型，参数70亿，但是tokenizer换成了tiktoken，使之有更好的多语言能力，词汇表大小也拓展到了100352，默认上下文长度是8K，模型也有分组查询注意力机制（GQA），从这个变化看，和 Llama3 的架构非常接近。

Phi-3-medium-14B 是新增的最大参数版本的Phi模型，参数140亿，架构与最小的Phi-3-mini-3.8B 相同，但是训练的epoch更多，训练的数据量和 Phi-3-small-7B 一样，4.9万亿tokens。但是这个模型比 Phi-3-small-7B 的提升不如 Phi-3-small-7B 相比 Phi-3-mini-3.8B 提升多。作者认为可能是数据问题，所以后面他们还会改进，因此，把这个 Phi-3-medium-14B 称为preview版本。

在这里插入图片描述

Phi系列模型的目的是希望在小规模参数的模型上获得传统大模型的能力。

一起回顾下微软轻量级AI模型——Phi系列模型的发展路程：

2023年6月，微软发布了《Textbooks Are All You Need》论文，用规模仅为 7B token 的「教科书质量」数据训练 1.3B 参数的模型 Phi-1，实现了良好的性能。
2023年9月，微软让 1.3B 参数的 Transformer 架构语言模型 Phi-1.5 显示出强大的编码能力。
2023年12月，微软发布 Phi-2，参数增长到27亿，具备了一定的常识能力，在 2.7B 的量级的多个基准测试成绩超过 Llama2 7B、Llama2 13B、Mistral 7B 等一众先进模型。
2024年4月，微软发布 Phi-3，包含3个版本，参数规模增长的同时，能力也大幅提高，并表示其性能比前一版本更好，其响应速度接近比它大 10 倍的模型。

在这里插入图片描述