微软Phi-3.5-Mini-Instruct全参微调中文版来啦

微软Phi-3.5-Mini-Instruct全参微调中文版来啦

原创 大头 AI工程师笔记 2024年08月24日 08:00 新疆

Phi-3.5-Mini-Instruct-Chinese

简介

8月21日,微软发布了Phi-3.5-mini-instruct模型。

Phi-3.5-mini-instructPhi-3模型家族的最新成员,专为高效、先进自然语言处理任务而设计。该模型具有 38 亿个参数,基于Phi-3 的数据集(合成数据和经过筛选的公开网站)构建,重点关注高质量、推理密集的数据。该模型属于 Phi-3 模型系列,支持 128K 令牌上下文长度。经过了严格的增强过程,结合了监督微调近端策略优化直接偏好优化,以确保精确遵守指令强大的安全措施。

Phi-3.5 mini 在中文场景有所增,但是受限于模型的大小,依然会有较多的事实错误。为了更好地适应中文场景OpenCSG社区Phi-3.5-mini-instruct模型进行了全参数微调,推出了中文版。这一版本基于大量中文语料,进行了深度优化,以提升模型在中文自然语言处理任务中的表现。经过微调的中文版在语义理解、上下文关联和文本生成的质量上均有显著提升,能够更好地满足中文用户在各种应用场景中的需求。

推理效果

与原始的instruct版类似,模型对中文内容理解的更加准确,输出的内容也更偏向中文,并且确保了问答性能与用户体验的优化。

图片

左图:Phi-3.5-mini-instruct中文微调版   右图:Phi-3.5-mini-instruct

经过中文微调的模型在各种应用场景中的需求,如语义理解、上下文关联和文本生成等方面有显著提升。以上对比测试显示,Phi-3.5 Mini Instruct 中文版在中文自然语言处理任务中的表现显著优于原始版本,这验证了微调过程的有效性,并展示了模型在中文语境下的适应能力和强大的生成性能。

模型下载

https://opencsg.com/models/OpenCSG/Phi-3.5-Chinese

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI生成曾小健

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值