Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

本文翻译了《Phi-3 Technical Report》的部分内容,介绍了一个38亿参数的语言模型phi-3-mini,它在手机上运行且性能接近Mixtral 8x7B和GPT-3.5。模型训练数据经过严格筛选,增强了安全性和稳健性,尤其在MMLU和MT平台上表现出色。此外,还提及了更大规模的phi-3-small和phi-3-medium模型,其性能更优。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone》的翻译。

Phi-3技术报告:手机本地的一个高能力语言模型

摘要

我们介绍了phi-3-mini,这是一个在3.3万亿个token上训练的38亿参数语言模型,其总体性能,通过学术基准和内部测试来衡量,可以与Mixtral 8x7B和GPT-3.5等模型相媲美(例如,phi-3-mini在MMLU上实现69%,在MT平台上实现8.38),尽管它足够小,可以部署在手机上。创新完全在于我们的训练数据集,这是phi-2所用数据集的放大版,由经过严格过滤的网络数据和合成数据组成。该模型还进一步调整了稳健性、安全性和聊天格式。我们还提供了一些针对4.8Ttoken训练的7B和14B模型的初始参数缩放结果,称为phi-3-small和phi-3-medium,两者的能力都明显高于phi-3-mini(例如,在MMLU上分别为75%和78%,在MT平台上分别为8.7和8.9)。

1 引言

2 技术规范

3 学术基准

4 安全性

</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值