[AI]算法小抄-总结大模型微调方式

AlgorithmWillBeFine

已于 2023-05-29 10:42:50 修改

阅读量1.2k

点赞数 2

文章标签：深度学习人工智能自然语言处理神经网络机器学习

于 2023-05-25 11:52:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44491772/article/details/130859060

版权

系列文章主要目的快速厘清不同方法的原理差异和应用场景，

对于理论的细节请参考文末的Reference，

Reference中会筛选较为正确，细节的说明

想要建构属于自己应用或特定垂直领域的大模型，除了类似LangChain, TaskMatrix.AI使用Prompt工程的方式，微调(Fine tunning)是更可控且可以持续迭代的方式，预训练语言模型(PLM) + Finetuning的方式也是目前主流的范式，以下介绍几个主流方案，每个方案针对的场景，所需要的数据，成本都不相同：

Supervised finetuning

Prompt tuning

相比于直接透过子任务的结构去进行finetuning，prompt tuning主要是让数据变成更像是预训练模型更熟悉的模式进行finetuning，前身是In-Context Learning (ICL)，比如文本情绪分类任务，传统的finetuning数据和promt-tuning区别如下

[Normal Fintuning]

Input: This movie is great

label: happy

[Prompt Tuning]

Input: This movie is great, feel [Mask]

label: This movie is great, feel happy

可以观察到Prompt-tining的数据更接近自然语言的表述，更接近PLM训练的dmomain。主要的步骤包含：模版建构(Template con

最低0.47元/天解锁文章

AlgorithmWillBeFine

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
[AI]算法小抄-总结大模型微调方式

以下根据适合的任务，成本对于上述的方法进行总结方法适合任务数据成本训练成本自然语言类型子任务，如：文本分类，语义分析...等中，模版设计和映射对于效果影响巨大低，一个子任务只需要少部分数据通用型分发任务，比如：API调度，AutoGPT等低，半自动化生成，参考Alpaca低，一个子任务只需要少部分数据RLHF强用户体验相关，比如：人格化，聊天...等高，需要人工打分以及人工撰写高，数据跟训练效果未知。
复制链接

扫一扫

AlgorithmWillBeFine CSDN认证博客专家 CSDN认证企业博客

码龄6年

10: 原创

130万+: 周排名

89万+: 总排名

2万+: 访问

: 等级

127: 积分

26: 粉丝

21: 获赞

11: 评论

92: 收藏

私信

关注

热门文章

最新评论

[AI]如何让语言模型LLMs流式输出：HuggingFace Transformers实现
hong01072: thread = Thread(target=model.generate, kwargs=generation_kwargs) thread.start() generated_text = "" count = 0 # 流式输出 for new_text in streamer: generated_text += new_text history = build_history(history, query, generated_text, turn_count) count += 1 if count % 8 == 0: os.system("clear") print(build_prompt(history), flush=True) os.system("clear") print(build_prompt(history), flush=True) 这里感觉有点怪，开启一个子线程执行，不阻塞主线程，到for循环遍历时，应该是不能保证子线程已执行完毕返回结果。是我的理解有误吗？
[AI]如何让语言模型LLMs流式输出：HuggingFace Transformers实现
zhe_csdn: 使用fastapi的时候，返回的结果看起来不像是流式的
[AI]如何让语言模型LLMs流式输出：HuggingFace Transformers实现
m0_62196601: 利用阿里云计算巢AppFlow可以实现实现模型对话流式输出，具体使用参见这篇文档（https://juejin.cn/post/7379431208429944841）
[OpenCV+FFMepg]使用FFMepg编码cv::Mat并写入视频
JasonLi30: 感谢感谢，哥你算是救了我了，今天差点就完不成任务了
手撕transformer-基于numpy实现
CSDN-Ada助手: 恭喜您撰写了第10篇博客，标题看起来非常吸引人！能够亲自动手实现transformer，并且使用numpy来完成，真是令人佩服。您的博客内容一直给读者带来了很多启发和帮助，我非常期待您未来的创作。对于下一步的创作建议，我建议您可以考虑进一步探索transformer的优化技巧，或者尝试在实现中加入一些实际应用场景的案例分析，这样读者可以更好地理解和运用这些知识。当然，这只是一个谦虚的建议，我相信您一定有更加精彩的想法和计划。期待您的新作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。