SSD算法单类别目标检测的YOLO格式的数据集踩坑合集

本文讲述了如何将单类别的YOLO格式数据集转换为VOC格式以适应SSD算法,涉及XML文件检查、txt文件内容清洗以及注意单类别VOC数据配置。
摘要由CSDN通过智能技术生成

 前言

需要用SSD算法对单类别的数据集进行目标检测,由于数据集是自己收集并标注的,所以只有YOLO格式的。

格式转换

SSD算法不能直接使用YOLO格式的数据集,需要将YOLO格式的数据集转化为VOC格式或COCO格式。作者是将YOLO格式转为VOC格式,因此YOLO转COCO格式在这里不再藐视。

清洗YOLO格式的数据集

由于SSD算法在VOC格式的数据集上不能接受Annotations文件夹下的xml文件中没有标注位置信息,且图片和标注文件的名称也要一一对应上(作者在这里踩了很大的坑!)。排查YOLO数据集中的labels文件夹下的txt文件内容是否为空的代码:

import os

def find_empty_txt_files(folder_path):
    empty_files = []
    for file_name in os.listdir(folder_path):
        if file_name.endswith(".txt"):
            file_path = os.path.join(folder_path, file_name)
            with open(file_path, 'r', encoding='utf-8') as file:
                content = file.read()
                if not content.strip():
                    empty_files.append(file_name)
    return empty_files

folder_path = 'D:\Code\pycharm\Test\VOC-v8-recent\labels' # 这里填入labels文件夹的绝对地址
empty_txt_files = find_empty_txt_files(folder_path)
print("Empty txt files:", empty_txt_files)

代码会返回txt内容为空的文件名,在进行格式转换前需要将这些txt和同名的图片删除,否则后续ssd算法会报错。

YOLO格式转COCO格式

作者这里使用的是zhihu大佬的代码:传送门目标检测中数据集格式之间的相互转换

ssd算法的注意事项

voc中的data/voc0712.py的

VOC_CLASSES =()为单类类别时,一定要加“,”,参考链接:SSD算法检测单类别报错:label_idx = self.class_to_ind[name] KeyError: ‘aeroplane‘-CSDN博客
  • 6
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值