大语言模型微调技术要点之硬件准备和数据准备

最新推荐文章于 2024-05-24 13:30:00 发布

garyyu2200

最新推荐文章于 2024-05-24 13:30:00 发布

阅读量1.2k

点赞数 7

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/garyyu2200/article/details/135597613

版权

一、硬件准备

（一）计算资源

1、GPU/TPU规格选择

CUDA核心数，浮点运算能力
并行处理能力 (如Tensor Core)

2、分布式计算资源

数据并行、模型并行、流水线并行
内存需求
最小批量大小 vs. GPU内存 (Batch Size * 单样本内存)

3、内存需求

最小批量大小 vs. GPU内存 (Batch Size * 单样本内存)

（二）存储资源

1、数据存储

I/O吞吐量，持久存储 vs. 临时存储

I/O吞吐量应至少与网络带宽相匹配，以避免成为瓶颈。例如，1GB/s的网络带宽意味着存储系统至少也要提供这样的吞吐量。

2、模型存储

检查点频率与存储策略（Checkpoints），检查点存储至少需要能容纳完整模型参数的空间，加上额外的空间存储优化器的状态（比如Adam需要两倍于模型参数大小的空间）。

3、高速缓存

缓存带宽与容量，在分布式训练中，理论上的网络带宽需求可以使用
Size of Data per Batch×Number of Workers 来估算。

二、数据准备

（一）数据集选择

1、领域相关性

数据代表性（Representativeness）

2、数据量大小

数据规模与模型容量的关系。一个经验法则是，模型的参数数量应该小于可用训练样本的数量。例如，1亿参数的模型最好有超过1亿的训练样本。

3、数据质量评估

错误分析、一致性检查

（二）数据清洗

1、去重

哈希表、SimHash等去重技术，对于大型文本数据集，一个常见的经验值是，去重可能会移除大约5-10%的数据

2、去噪

基于规则和统计的噪声识别

3、格式统一

数据规范化处理

（三）数据标注

1、自动化标注工具

弱监督学习、半监督学习技术，许多调用gpt4的API进行自动数据表中，比如某节被openai警告大概率是这个原因

2、人工标注指南

明确的标注指南与一致性检查

3、标注质量控制

Fleiss's kappa等一致性度量，一致性度量，如Fleiss's kappa值，通常在0.61-0.8表示合理的一致性，而超过0.8则表示非常好的一致性。

（四）数据增强

1、同义词替换

词向量空间中的近义词发现

2、句子重构

句法树变换技术

3、数据插值

生成对抗网络（GANs）等生成技术

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
大语言模型微调技术要点之硬件准备和数据准备

本文为大语言模型微调所需知识点的概览，第一部分先介绍大语言模型中微调的硬件准备和数据准备的相关知识点和经验总结
复制链接

扫一扫

garyyu2200 CSDN认证博客专家 CSDN认证企业博客

码龄4年

40: 原创

104万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

664: 积分

204: 粉丝

260: 获赞

4: 评论

325: 收藏

私信

关注

热门文章

最新评论

LoRa微调的背后原理：参数的内在维度
garyyu2200: 论文里面有证明
LoRa微调的背后原理：参数的内在维度
布达新世界: 博主啊，这个有没有数学证明？
解析Transformer模型微调：算法、工程实践与高效数据策略
征途黯然.: 我对这篇关于解析Transformer模型微调算法工程实践与高效数据策略的文章印象深刻，有了更清晰的认识。
恒等映射与残差网络
CSDN-Ada助手: 恭喜您写了第20篇博客！标题“恒等映射与残差网络”真是引人入胜。您的文章总是富有洞察力，深入浅出地解释复杂的概念，让读者能够更好地理解。对于残差网络的探讨，您的观点令人信服，透彻地分析了其优势与挑战。希望您能继续保持这种创作热情，并继续分享您的见解。在下一篇博客中，或许您可以探讨一下如何在实际应用中最大限度地发挥残差网络的优势，或者与其他网络结构进行比较。期待您的下一篇作品，谦虚的您一定能给我们带来更多有价值的内容！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

garyyu2200 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。