使用huggingface 领域数据适配预训练

最新推荐文章于 2024-10-24 03:30:00 发布

choose_c

最新推荐文章于 2024-10-24 03:30:00 发布

阅读量1.1k

点赞数 1

分类专栏：深度学习自然语言处理文章标签： python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/choose_c/article/details/118990226

版权

自然语言处理同时被 2 个专栏收录

43 篇文章 7 订阅

订阅专栏

33 篇文章 0 订阅

订阅专栏

如果自己有一批数据，想要使用预训练模型再进行领域数据的适配，可以使用huggingface中的run_mlm.py进行训练。

最近在训练的时候遇到一个问题：训练的时候GPU占用上升导致out of memory。

详细问题描述：pytorch 使用 transoformers(version=4.8.2)中 run_mlm.py 进行垂直领域数据适配预训练的时候；GPU显存占用量慢慢上升，但是并不是一直在升，隔几百个step之后会有一个量(1G)的上升并稳定一段时间后再次上升; 直至 out of memory。

代码的报错位置是：

网上查了下，看到了这个解答：

和报错位置的代码差不多，但是这个问题应该是pytorch之前版本的问题了，新的版本应该已经修复这个问题了；试了一下解决方法，果然还是有上述问题。
接着就看到了这个博客，对局部的损失loss进行了删除并回收。

加入了这两行语句，简单暴力，再看gpu的使用会在两个值之间跳动，应该是代码生效了。

总结：原因应该是，损失累加的时候有很多局部的损失没有删除；因为训练循环没有结束，所以一直占用显存。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

choose_c CSDN认证博客专家 CSDN认证企业博客

码龄8年

78: 原创

7万+: 周排名

6万+: 总排名

14万+: 访问

: 等级

1506: 积分

134: 粉丝

186: 获赞

34: 评论

410: 收藏

私信

关注

热门文章

分类专栏

langchain 2篇
RAG 4篇
文本表示 13篇
ACL2023 2篇
深度学习 33篇
大模型 3篇
chatgpt 1篇
shell
tensorflow 2篇
机器学习 17篇
自然语言处理 43篇

最新评论

Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
OpenAI的Function calling 和 LangChain的Search Agent
Glen don: 内部实现是在训练的时候就训练了这个能力，训练数据包含了函数的描述以及返回的结果
大模型时代下两种few shot高效文本分类方法
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
RAG常见七大坑
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
OpenAI的Function calling 和 LangChain的Search Agent
choose_c: langchain的agent是通过设计prompt实现，function calling是openai API调用自带的功能，内部实现我猜也是通过prompt实现。openai的prompt效果应该会比第三方的prompt写的更合适吧。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。