QLoRA增量预训练与指令微调，及汉化Llama2的实践

最新推荐文章于 2024-06-09 22:44:36 发布

u013250861

最新推荐文章于 2024-06-09 22:44:36 发布

阅读量322

点赞数

分类专栏： # LLM/预训练&SFT 文章标签：指令微调

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/134300600

版权

LLM/预训练&SFT 专栏收录该内容

84 篇文章 81 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了基于QLoRA的轻量级增量预训练和指令微调方法，用于提升Llama2在中文任务上的性能。通过中文词表扩充、增量预训练和指令微调，模型在CMMLU和Open LLM Leaderboard上展现出竞争力，同时在人工评测中表现出色。开源项目包含了训练权重、代码和数据。

摘要由CSDN通过智能技术生成

我们探索和实现了一种基于QLoRA的轻量级的增量预训练和指令微调方案，并使用该方法对Llama2-13B进行中文知识迁移，在公开榜单和人工评测中验证了该方法的有效性。该方法可推广至对Baichuan、Qwen、InternLM、Falcon等模型的垂直域增量预训练与指令微调。

在CMMLU榜单上，我们的模型优于Linly、Yayi、FlagAlpha等，与Ziya、Chinese-Alpaca-Plus及其接近。在🤗Open LLM Leaderboard上，我们的模型与Vicuna、Guanaco、Llama2及其接近。

在中文人工评测中，我们的模型以66.15%胜、30.77%平、3.08%负的成绩大幅领先Llama2，以33.08%胜、60.77%平、6.15负的成绩领先Linly。

上述评测结表明了我们的方法能够在提升Llama2的中文能力的基础上，保留Llama2优秀的英文能力。

本文将对该工作进行介绍，我们也开源了模型权重、训练代码、训练数据等，欢迎大家关注和Star⭐️我们的项目。

增量预训

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
QLoRA增量预训练与指令微调，及汉化Llama2的实践

为了探索基座模型的影响，我们也使用QLoRA技术对Baichaun2-13B-Base进行指令微调，其在CMMLU上的表现大幅领先我们评测的所有中文Llama模型，优于ChatGPT、baichuan-13b-chat等模型，且仅比baichuan2-13b-chat略低1.57分。在CMMLU榜单上，我们的模型的表现优FalgAlpha、Yayi、Linly等中文Llama模型，与Ziya、Chinese-Alpaca-Plus等模型非常接近，与官方的Llama2相比也有所提升。数据分布如下图所示。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。