Bert的缓存问题

最新推荐文章于 2024-05-11 00:04:35 发布

成电摸鱼郎

最新推荐文章于 2024-05-11 00:04:35 发布

阅读量595

点赞数

文章标签： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wslhynn277/article/details/104367854

版权

在使用Bert做UNILM的摘要任务时，出现了一个非常奇怪的问题，之前用小数据集跑出来效果还不错，于是修改了一些训练参数（学习率，warmup等），换了一个大数据集来跑，效果很差，所以又把所有参数回滚了，并且重新换上小数据集，这时候却发现效果同样变得非常差。

尝试过重写解码部分、用modeling_bert.py中的模型链接重新下载一个模型，并在微调时使用这个新的模型训练、删除所有保存过的权重，都不行，最后怀疑bert是否存在这种缓存问题，上谷歌一查，还真有人跟我遇到相同问题，于是删除了位于**~/.cache/torch/transformers**下的所有文件，重新训练，问题（莫名其妙地）解决。

成电摸鱼郎

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Bert的缓存问题

在使用Bert做UNILM的摘要任务时，出现了一个非常奇怪的问题，之前用小数据集跑出来效果还不错，于是修改了一些训练参数（学习率，warmup等），换了一个大数据集来跑，效果很差，所以又把所有参数回滚了，并且重新换上小数据集，这时候却发现效果同样变得非常差。尝试过重写解码部分、用modeling_bert.py中的模型链接重新下载一个模型，并在微调时使用这个新的模型训练、删除所有保存过的权重，都...
复制链接

扫一扫

成电摸鱼郎 CSDN认证博客专家 CSDN认证企业博客

码龄8年

9: 原创

28万+: 周排名

219万+: 总排名

2万+: 访问

: 等级

340: 积分

1: 粉丝

23: 获赞

7: 评论

21: 收藏

私信

关注

热门文章

最新评论

CUDA error: device-side assert trigger
nishimiyashioko: 感谢博主，我也是这个问题呜呜呜，太感谢了
Bool value of Tensor with more than one value is ambiguous
成电摸鱼郎: 哈哈哈哈哈哈哈不好意思,这些博文本来是写给我自己看的.如果使用tensor变量来进行if条件判断的话,一共有两种情况:第一种情况是进行真假判断,第二种情况是进行非空判断.对于第一种情况,if条件语句写成“ if tensor:" ,在这种情况下,不论tensor的形状维度如何,tensor中只能含有一个值,这个值如果是布尔变量,那么就按照布尔变量的真假进行判断,如果是其他类型的值,那么这个判定将恒为真;对于第二种情况, if条件语句应该写成“ if tensor is not None”, 这个时候tensor内的值的个数任意,类型任意,维度任意,只要这个tensor不是None,都会判断为真. 上面是我的理解,最后,给国产垃圾技术博文添砖加瓦是我的不对,抱歉哈哈哈哈哈哈哈
Bool value of Tensor with more than one value is ambiguous
guanyonglai: 我也不知道说的什么鬼，但是我这么改他就行了
Bool value of Tensor with more than one value is ambiguous
weixin_38677127: 说的都是什么鬼
CUDA error: device-side assert trigger
qq_42222051: 感谢博主，正愁找不到报错位置

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。