微软Phi-3 Mini炸裂来袭：轻量级AI模型的崛起，性能与效率双重突破

@斜杠君

已于 2024-04-25 15:35:04 修改

阅读量982

点赞数 8

分类专栏： AI研习社文章标签：人工智能 microsoft AI gpt chatgpt llama 语言模型

于 2024-04-25 15:33:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/andy_68147772/article/details/138190917

版权

AI研习社专栏收录该内容

15 篇文章 1 订阅

订阅专栏

🧙‍♂️ 诸位好，吾乃斜杠君，编程界之翘楚，代码之大师。算法如流水，逻辑如棋局。

📜 吾之笔记，内含诸般技术之秘诀。吾欲以此笔记，传授编程之道，助汝解技术难题。

📄 吾之文章，不以繁复之言，惑汝耳目；但以浅显之语，引汝入胜。

🚀 若此文对阁下有所裨益，敬请👍🏻-点赞 ⭐ - 收藏 👀 - 关注，不胜感激。

什么是Phi-3 Mini

Phi-3 Mini是微软研究院推出的一款小型语言模型，它属于Phi-3系列模型的一部分。这个系列包括不同规模的版本，旨在提供与大型模型相媲美的语言理解和推理能力，同时保持较小的参数规模和高效的运算性能。

技术报告地址：https://arxiv.org/abs/2404.14219

性能对比

与Mixtral 8x7B对比

Mixtral 8x7B是一个参数量达到56亿的模型，以其强大的语言理解能力而闻名。然而，Phi-3 Mini在某些任务上的表现却能与这个大家伙相媲美，这不禁让人对Mini的效率和性能刮目相看。

与GPT-3.5对比

GPT-3.5是著名的大型语言模型，拥有千亿级别的参数量。尽管如此，Phi-3 Mini在特定的语言理解任务上，如文本摘要和情感分析等，展现了不输于GPT-3.5的性能，这在AI界无疑是一次令人振奋的突破。

与Llama3 8B 对比

Meta的Llama3 8B 模型，拥有80亿参数，是一个在多语言理解和指令遵循方面表现出色的模型。Phi-3 Mini虽然在多语言能力上可能还不如Llama 3，但在英语任务上，它已经显示出了可以一较高下的实力。

Phi-3 Mini的关键技术

1. 大规模高质量数据集

Phi-3模型的训练基于一个庞大的数据集，包含了3.3万亿至4.8万亿的tokens。这些数据并非随意选取，而是经过了严格的筛选和过滤。微软专注于使用具有高教育水平和质量的数据，这有助于模型学习到更加准确和专业的知识。

2. 合成数据生成

除了真实世界的数据，微软还利用大型语言模型（LLM）生成合成数据。这些合成数据不仅丰富了模型的训练集，还特别针对逻辑推理和专业技能的教学。通过这种方式，Phi-3系列模型能够学习到更加多样化和专业化的知识。

3. 分阶段训练策略

Phi-3模型的训练分为两个阶段。第一阶段主要使用网络数据，目的是让模型掌握通用的知识和语言理解能力。第二阶段则在第一阶段的基础上，进一步筛选网络数据，并结合合成数据进行训练，以增强模型的逻辑推理能力。

4. 量化处理

为了使模型能够在手机上运行，Phi-3-Mini采用了4-bit量化技术，这显著减少了模型的内存占用，使得模型即便在资源受限的移动设备上也能高效运行。

5. 多语言探索

虽然Phi-3-Mini主要针对英语，微软也在积极探索小型语言模型的多语言能力。Phi-3-Small模型就通过增加更多的多语言数据进行了训练，以提升模型对不同语言的理解和支持。

通过这些技术，微软的Phi-3 Mini不仅在AI性能上取得了突破，也为智能手机的AI应用带来了革命性的变化。随着技术的不断发展，我们可以期待Phi-3 Mini将在移动设备上释放更大的潜力，为用户带来更加智能和便捷的体验。

好了，关于Phi-3 Mini的信息就为大家分享到这里。我为大家整理了关于Phi-3 Mini的相关网址，大家可以到这里了解更详细的信息，可以亲自体验一下哦：）

开源地址：https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

Ollama地址：https://ollama.com/library/phi3

技术报告：https://arxiv.org/abs/2404.14219

🧙‍♂️ 诸位好，我是斜杠君。全栈技术，AI工作流技术研究者。分享探索AI技术等干货内容。如果您有关于扣子CozeAI工作流的特别需求问题，也可以通过 爱发电 向我提问。

👑 阁下若觉此文有益，恳请👍🏻-点赞 ⭐ - 收藏 👀 - 关注，以资鼓励。倘若有疑问或建言，亦请在评论区💬评论赐教，吾将感激不尽。

欢迎关注我的公众号

关注

8
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。