微调大语言模型——超详细步骤

萱仔学习自我记录

已于 2024-10-06 21:18:19 修改

阅读量915

点赞数 21

分类专栏：萱仔大模型学习记录萱仔NLP集锦文章标签：深度学习人工智能机器学习

于 2024-10-05 23:57:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44117805/article/details/142712300

版权

萱仔大模型学习记录同时被 2 个专栏收录

15 篇文章

订阅专栏

萱仔NLP集锦

8 篇文章

订阅专栏

微调一个语言模型，其实就是在一个已经训练过的模型上，继续用新数据进行训练，帮助模型更好地理解和处理这个新的任务。可以把这个过程想象成教一个已经懂很多道理的人去解决新的问题。

这个过程可以分为五个简单的步骤：

加载预训练模型和新的数据集：先拿到一个已经训练过的模型，它已经掌握了一些基础能力。然后，再准备一个新的数据集，这个数据包含你希望模型学会的新任务，比如解数学题的训练数据。
预处理模型和数据集：把数据整理成模型能理解的格式，比如把数学题和答案编码成数字。模型只能理解特定格式的数据，所以需要先做这一步。
开始循环训练：训练模型时，它会一遍遍看新数据，慢慢学会解决这些问题。通过训练过程，模型会逐渐调整自己的参数，更好地回答问题。
测试模型：一旦模型完成了训练，你可以用它从未见过的测试数据来检查它的表现。测试数据跟训练数据不同，是用来验证模型是否真的学会了这个新任务。
评估模型：在测试后，使用一些评价指标来量化模型的表现。比如我们可以通过正确率、准确率等方法来评估它是不是能够很好地解题。

就是例如我已经有一个已经学会了日常对话的AI工具人，现在如果想教它解英语的问题，学习一下。首先，我得下载这个AI的这个工具人（模型），然后又要给它准备一套题和答案（新数据集）。然后再把这些题目整理成它能读懂的格式，最后让它一遍又一遍地看和学习这些题目和答案，通过反复练习，逐渐让它变得擅长解题。一旦模型完成了训练，你可以用它从未见过的测试数据来检查它的表现。测试数据跟训练数据不同，是用来验证模型是否真的学会了这个新任务。在测试后，使用一些评价指标来量化模型的表现。比如我们可以通过正确率、准确率等方法来评估它是不是能够很好地解题。

然后比如我要做的这个让他学习问题，然后使用了以下这个数据集

数据集下载地址：

https://huggingface.co/datasets/zeaver/multifactor_squad1.1_zhou/tree/mainhttps://huggingface.co/datasets/zeaver/multifactor_squad1.1_zhou/tree/main然后我这边下载好数据集：

每条记录包括以下字段：

id: 问题的唯一标识符。
answer: 问题的正确答案。
question: 要回答的问题。
context: 提供问题答案的上下文段落。
p_phrase: 正相关短语，用于问题背景中的重要词汇。
n_phrase: 负相关短语，可能与问题相关但不直接提供答案。
full answer: 一个完整的句子，描述问题的答案。

包括问题和答案，还提供了上下文段落及相关短语，有助于模型理解背景信息。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。