bert+crf代码RuntimeError CUDA error异常的原因以及解决方法

本人在跑Bert+CRF代码时候遇到此问题:发生异常:RuntimeError CUDA error: device-side assert triggered
在这里插入图片描述

原因分析:

在debug过程中,代码在cuda无法查看具体出错的原因,这个时候我们需要将代码更改为在cpu运行(经过高人指点:cuda发生错误,都可以在cpu版本找到具体的错误原因)

解决方法

更改为cpu运行后,发现是因为标签越界了,更改正确即可

标签越界原因分析

我在文本补全时,将pad编号设置为-100(因为想要pad在交叉熵计算是失效)这个编号导致了错误发生。
经过实验,我发现通过pytroch-crf库调用的crf无法处理编号为负数的标签。事实上我们也无需设置特定的标签令它失效,因为只要将正确的attention_mask传进crf,它就能自动忽略pad的token

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值