Mobilenetv3-ssd训练VOC格式数据集loss出现nan:数据本身出现问题

十分感谢链接博主:
https://blog.csdn.net/weixin_40313940/article/details/105915575
在这里插入图片描述
训练一开始就出现nan,调参不能解决,那应该就是数据本身出现问题了,先将batch_size设为1(如果网络有BN层有可能会报错),然后shuffle=False,开始逐张图片进行检查,剔除有问题的即可。

十分感谢参考链接博主给出的问题根源:xml文件中存在min>max的错误情况,导致导入的数据成为了“bad sample”,存在问题的xml文件如下图:
在这里插入图片描述

利用博主给出的脚本就可以快速找到问题xml文件,不过脚本可能有点问题,下面给出修改后的代码:

import os
import xml.etree.ElementTree as ET

xml_dir = 'your Annatations path'


def compare_min_max(xml_dir):
    xmls = os.listdir(xml_dir)
    xmls.sort()
    flag = 0
    count = 0
    for xml in xmls:
        xml_path = os.path.join(xml_dir, xml)
        tree = ET.parse(xml_path)
        root = tree.getroot()
        for elem in root.findall('object'):
            xmin = elem.find('bndbox').find('xmin').text
            ymin = elem.find('bndbox').find('ymin').text
            xmax = elem.find('bndbox').find('xmax').text
            ymax = elem.find('bndbox').find('ymax').text
            #if int(ymin) > int(ymax) or int(xmin) > int(xmax):  # 原代码
            #if ymin > ymax or xmin > xmax:  # 这句代码会得到错误的结果, 不存在min>max
            if int(float(ymin)) > int(float(ymax)) or int(float(xmin)) > int(float(xmax)):  # 修改后的代码
                print('min > max in file:', xml_path)
                flag = 1
        if flag == 1:
            count += 1
            flag = 0
    print('{} files that min > max'.format(count))
    print('finish comparision...')


if __name__ == '__main__':
    compare_min_max(xml_dir)
  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值