amp错误ZeroDivisionError: float division by zero

#amp错误ZeroDivisionError: float division by zero
##查资料查了半天,发现网上大多给出的原因是除数里面有0
但是仔细查看代码报错的位置好像和apex中的amp有关
又结合一些网上的训练代码对比发现下列这块代码不一样,问题应该就是出在这块

                masks_pred = net(imgs)
                loss = criterion(masks_pred, true_masks)
                epoch_loss += loss.item()
                writer.add_scalar('Loss/train', loss.item(), global_step)
                pbar.set_postfix(**{'loss (batch)': loss.item()})

                optimizer.zero_grad()
                #loss.backward()
                with amp.scale_loss(loss, optimizer) as scaled_loss:
                     scaled_loss.backward()
                optimizer.step()

主要就是在这里

                optimizer.zero_grad()
                #loss.backward()
                
                with amp.scale_loss(loss, optimizer) as scaled_loss:
                     scaled_loss.backward()
                optimizer.step()

不太一样
修改方法:改成下面这样

                optimizer.zero_grad()
                loss.backward()
                
                #with amp.scale_loss(loss, optimizer) as scaled_loss:
                     #scaled_loss.backward()
                optimizer.step()```
重新运行训练代码,成功解决问题。即放弃了使用apex的加速功能,不过总比跑不起来代码要好!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值