【报错】CUDA error: device-side assert triggered

这种类型的报错,绝大多数情况下,都是因为tensor index的错误。比方说,一些torch的index操作,如torch.select等;或者输入的input_ids超出了模型embedding的词表范围。

以超出embedding的词表范围为例,会报出这种很抽象的trace back:
在这里插入图片描述

如果遇到这种报错,推荐的一个做法是,在传给模型inputs之前,先把所有ids都限制到词表范围之内:

# there could be some ids out of vocab. e.g., -100
zeros = torch.zeros_like(input_ids)
min_ids, max_ids = 0, len(tokenizer)-1
# make sure the ids are in the range of vocab
# 小于min_ids 或者 大于max_ids 位置的那些ids,会被替换成zeros的对应元素值,否则保留原input_ids的值
input_ids = torch.where(torch.lt(input_ids,min_ids) | torch.gt(input_ids,max_ids),zeros,input_ids)

outputs = model(input_ids)

当然也可以直接clip,上述操作的一个好处就是可以把超出词表范围的那些ids替换成某个具体的ids,比方说padding tokens、ending tokens。在某些情况下会比较实用。


参考:

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值