Yolov5 lite 重新训练COCO数据(只训练COCO含Person部分,其他当负样本)

一、数据准备

  1. 本文使用的YoLov5 lite 对COCO进行重新训练。这里需要提出的出,YOLO针对训练样本的数据划分,是不能直接采我们下载的COCO数据划分方式的的,需要将COCO中的json文件划分成txt文件(这里目标检测,就针对instances)。txt中存放的是每张图片中含有目标对象的类别和anchor的坐标。YOLO的数据集的划分目录结构如下:
    images:
    train2017:
    xxxxx.jpg
    xxxxx.jpg

    val2017:
    xxxxx.jpg
    xxxxx.jpg

    labels:
    train2017:
    xxxxx.txt
    xxxxx.txt

    val2017:
    xxxxx.txt
    xxxxx.txt

一、 修改文件

1.我们把数据集划分好了以后,并且放在了你一般放数据集的地方后,我们需要去修改一些配置文件,让我们训练的时候可以找到这些数据集。我们下载好yolo项目以后,我们找到data文件夹下的coco.yaml。我们修改里面的参数

train: ../../data/object/COCO/Yolo/images/train2017  # 118287 images
val: ../../data/object/COCO/Yolo/images/val2017  # 5000 images

这里修改的是我们数据集的路径,需要注意的是这里填的是图像的路径,label训练代码会自己找到。

# number of classes
nc: 1

这个是类别的数量。我这里是要Person这个类,所有类别为1

# class names
names: [ 'person' ]

类别名称

2. 修改完数据部分以后,我们需要去修改models文件夹下的文件,这个文件夹下有几个版本权重的配置文件,我们针对你使用的权重版本,我这里用的是v5Lite-s.pt,所以我修改v5Lite-s.yaml这个配置文件中的 nc 参数,我只有一个类,所以修改为1。

nc: 1  # number of classes

修改完配置文件以后,因为我们只要针对Person进行识别,我们只需要Personlabel信息,其他类别的信息就不要了,直接为负样本。针对这里,我们需要去修改utils文件夹下的dataset的代码。

a. 因为YOLO会对数据做一个cache为方便读取数据,那我们在cache阶段就将我们Person单独取出来。我们找到cache_labels这个函数。

 # verify labels
        # 这里就是读trian/label的地方
        if os.path.isfile(lb_file):
            nf += 1  # label found
            with open(lb_file, 'r') as f:
                person_list = []
                l = [x.split() for x in f.read().strip().splitlines()]

                # 只将含有person的数据放入cache
                for ll in l:
                    if ll[0] == '1':
                        person_list.append(ll)
                l = person_list

我们新建一个person_list 用来存person的信息,我们读label的时候,是针对一个文件一行一行的读取(因为一个txt中有多个类型的信息),每一行的数据构成是 【类别id,anchor的坐标信息一共四个值】 。例如: 【58 0.389578 0.416103 0.038594 0.163146】 ,因为我需要的是person,person的类别id是1,所以我只保留为1的数据,这里的代码就非常的简单了。

这里修改好以后,就可以按照正常的要求进行训练啦!

  • 3
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
您好!感谢您的提问。Yolov5-lite是一个基于PyTorch实现的目标检测算法,它是Yolov5系列中的一个轻量级版本。训练数据集对于目标检测算法的训练非常重要,以下是一些关于训练数据集的注意事项: 1. 数据集收集:首先,您需要收集包您感兴趣的目标类别的图像数据集。这可以通过从互联网上下载现有数据集,或者自己拍摄和标注图像来实现。 2. 标注数据:在训练Yolov5-lite之前,您需要为每个图像标注目标边界框和类别标签。常用的标注工具包括LabelImg、Labelbox和RectLabel等。 3. 数据增强:为了增加模型的鲁棒性和泛化能力,您可以使用数据增强技术来扩充数据集。常用的数据增强方法包括随机裁剪、缩放、翻转、旋转等。 4. 数据格式:Yolov5-lite使用的数据格式是YOLO格式,每个图像对应一个同名的txt文件,txt文件中包每个目标的边界框坐标和类别标签信息。 5. 数据划分:将整个数据集划分为训练集和验证集,通常采用70%~90%的数据作为训练集,剩余的作为验证集,以评估模型的性能。 6. 训练配置:在进行训练之前,您需要编写一个训练配置文件,指定模型的参数、数据集路径、类别标签等信息。在配置文件中,您还可以设置训练的超参数,如学习率、批大小等。 7. 训练过程:最后,使用Yolov5-lite训练脚本开始训练。在训练过程中,模型将根据输入图像和标注信息进行反向传播优化权重,以提高对目标的检测精度。 希望以上信息对您有所帮助!如果您还有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值