LLaMA微调入门-医学问答机器人研发中的必备知识点与实现

最新推荐文章于 2024-07-12 14:11:53 发布

u013250861

最新推荐文章于 2024-07-12 14:11:53 发布

阅读量103

点赞数

分类专栏： # LLM/预训练&SFT 文章标签： llama 机器人人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/133978740

版权

LLM/预训练&SFT 专栏收录该内容

84 篇文章 71 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

作为算法工程师的你是否对如何应用大型语言模型构建智能肿瘤问答系统充满好奇？是否希望深入探索LLaMA（类ChatGPT）模型的微调技术，进一步优化参数和使用不同微调方式？现在笔者会带您领略大模型训练与微调进阶之路，拓展您的技术边界！

通过阅读文章，读者将能够了解LLaMA（类ChatGPT）微调的相关内容，并理解训练过程中的 Batch_size、数据类型、Zero 等参数设置以及 Lora 方式、Ptuning 方式等微调方式的应用。此外，读者将会了解优化器定义与参数的设定，同时了解和掌握监视器工具 Wandb 的使用。

除此之外，文章还会介绍包括数据准备、ChatGPT 数据生成流程等。对于微调方式，课程将分别以 Lora 方式、Ptuning 方式为例进行演示，并讲解合并 lora 参数与原始参数的方法、Fsdp 与 deepspeed 的全参数微调技巧等内容。最后，针对模型效果的测评，还将对相关指标进行说明和分析，帮助学员掌握有效评估模型性能的方法。

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LLaMA微调入门-医学问答机器人研发中的必备知识点与实现

为了提高效率，可以将计算和通信并行起来，GPU在反向传播阶段，可以待梯度值填满bucket后，一边计算新的梯度一边将bucket传输给CPU，当反向传播结束，CPU基本上已经有最新的梯度值了，同样的，CPU在参数更新时也同步将已经计算好的参数传给GPU。基于大模型的内在低秩特性，增加旁路矩阵来模拟全模型参数微调，LoRA通过简单有效的方案来达成轻量微调的目的，可以将现在的各种大模型通过轻量微调变成各个不同领域的专业模型。流水线并行训练的一个缺点是，会有一些设备参与计算的冒泡时间，导致计算资源的浪费。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。