多卡运行BERT代码报错:StopIteration: Caught StopIteration in replica 0 on device 0.

报错截图:

在这里插入图片描述


问题描述:

我之前是在一张3090ti上跑的代码,没有报错,pytorch版本是1.11,python是3.7,cuda版本是11.0。当我切换到两个卡(一个是3090ti,另一个是3060)运行时出现这个错误。感觉应该是torch版本和显卡兼容问题,pytorch版本高了。但是降级的话很麻烦。因此看看能不能修改下源码。


解决方案:

那么看报错的地方:

在这里插入图片描述
这句话:

extended_attention_mask = extended_attention_mask.to(dtype=next(self.parameters()).dtype)

将next(self.parameters()).dtype修改成torch.float32:

extended_attention_mask = extended_attention_mask.to(dtype=torch.float32)

再次运行代码,解决问题!!


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值