ZBT的博客-CSDN博客

在上一篇文章中，我在魔搭社区中进行了参数的微调，如果需要将微调参数加载到本地。需要注意在完成swift微调之后，如果想将微调模型参数本地化，需要将文件中小文件一个一个下载，因为魔搭不支持文件夹的下载。本次我进行微调的大模型是 deepseek-math-7b-instruct，在本地需要下载swift(只需要下载LLM版就行)如果有GPU较好，可以更改device_map；如果没有也可以使用CPU。

2024-05-30 19:31:10 212

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（四）

本次博客将更新如何使用swift进行模型的微调。在开始之前可以学习LLM的微调文档。为了更了解swift的结构，我们可以访问github上swift来查看其支持的模型与数据集。

2024-05-30 16:16:35 132

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（五）

与BERT类似，在输入文本中选择15％的字符，并且所选的字符是（1）80％的概率被屏蔽字符[ M A S K 2 ] [MASK2][MASK2]替换，或（2）10％的概率被随机字符替换，或者（ 3）10％的概率保持不变。当MLM是唯一的预训练目标时，可按照Rothe et al. (2019) 的方法对下游任务进行微调，即Transformer解码器会与编码器共享所有参数。在RTD任务中，输入文本的某个token被特殊标记符号[MASK]所替换，模型的目标是判断该Token在预训练中是否被替换。

2024-05-30 15:37:27 201

2201_75314780的博客

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（十三）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（十四）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（十二）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（十一）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（九）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（八）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（十）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（七）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（六）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（四）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（五）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（三）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（二）

原创教育领域“知之”大模型--山东大学软件学院2024年项目实训（一）

空空如也

空空如也