大模型微调到底有没有技术含量，或者说技术含量到底有多大？-CSDN博客

本文链接：https://blog.csdn.net/jennycisp/article/details/147644953

我教你用ChatGPT提供的接口做微调，几分钟就能上手。

我用ChatGPT提供的API做过微调1\，一共跑了138轮，最后面的loss降的还算平稳。（具体操作方法在文末）

在这里插入图片描述

最后面花了0.09美元。

在这里插入图片描述

我想要实现的是让ChatGPT输出的语气语调要带有「道家思想」，下面是我之前做的测试，你可以看到。

我问它「如何应对压力？」

经过微调后的ChatGPT给我的回答：应对压力要心无杂念。庄子说”无忧无虑，何须畏忧“。
在这里插入图片描述

这就是我要的效果，因为最原始的ChatGPT做不了某些特定需求的工作，比如说它对于中国的古诗词的效果就不太好，大概率是因为它的训练数据中没有包含全部的古诗词，所以微调fine-tuning、RAG、Prompt工程其实都是在原有的模型上打补丁。

在这里插入图片描述

其实微调很好理解，就是一个高考完的学生，天文地理都懂一些，但是让他们干某一件具体的的事情，比如从切菜、配料和炒菜这样的活他们是干不了的。

他们知道刀可以切菜，但是什么菜怎么切最好是没有经验的；炒菜也一样，他们的物理化学肯定学了高温下的化学反应，但是具体的菜什么火候他们并不懂，所以需要做一下专项训练，也就是微调。在对OpenAI的API进行微调时，我遇到的最大问题是准备数据集，因为其他步骤基本上都是自动化的。

这是我准备的数据集，你可以看到跟训练好的GPT的输出非常的像，因为这就是我要的效果。

{“messages”: [{“role”: “system”, “content”: “道言是一个基于道家思想和语录回答问题的聊天机器人。”}, {“role”: “user”, “content”: “如何找到内心的平静？”}, {“role”: “assistant”, “content”: “内心的平静在于清心寡欲。正如庄子所言：‘淡泊以明志，宁静以致远。’”}]} {“messages”: [{“role”: “system”, “content”: “道言是一个基于道家思想和语录回答问题的聊天机器人。”}, {“role”: “user”, “content”: “如何面对挫折？”}, {“role”: “assistant”, “content”: “面对挫折，要像水一样柔韧。老子说：‘上善若水，水善利万物而不争。’”}]}

数据集的质量实际上决定了微调后模型的效果。总体来说，用现成的微调工具，比如说OpenAI的会会非常的简单，效果是由你的数据决定的。

但是有一个问题，那就是OpenAI的模型都是闭源的，如果你的数据是保密的或者说不能承受数据泄露的风险，那必须使用开源大模型，比如Llama。对于这方面的教程，建议大家参考智泊AI的这门大模型公开课，里面详细介绍了各种开源和闭源大模型，以及相关的技术细节，课程入口微信扫码可获取。

在这里插入图片描述