Pysot训练自己数据集前的预处理

本文介绍了如何使用Pysot对自定义视频数据集进行预处理,包括par_crop.py、parse_vid.py和gen_json.py三个步骤。针对.txt格式的ground_truth,调整了bndbox信息,并详细说明了json文件的生成过程,确保训练时数据路径的正确性。
摘要由CSDN通过智能技术生成

预处理后的训练:

Pysot训练自己的数据集_Vesper0412的博客-CSDN博客

Pysot源码地址: GitHub - STVIR/pysot: SenseTime Research platform for single object tracking, implementing algorithms like SiamRPN and SiamMask.

因为我用的数据集是视频数据集,所以比照着Pysot中使用的VID数据集进行预处理。

VID数据集的标签是以.xml格式存储的,具体如下:

<?xml version="1.0"?>
<annotation>
    <folder>ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000</folder>
    <filename>000000</filename>
    <source>
        <database>ILSVRC_2015</database>
    </source>
    <size>
        <width>1280</width>
        <height>720</height>
    </size>
    <object>
        <trackid>0</trackid>
        <name>n01674464</name>
        <bndbox>
            <xmax>1050</xmax>
            <xmin>323</xmin>
            <ymax>428</ymax>
            <ymin>216</ymin>
        </bndbox>
        <occluded>1</occluded>
        <generated>0</generated>
    </object>
</annotation>

但我使用数据集的ground_truth是以 ‘.txt’ 形式存储的,所以代码调整一下。

1、par_crop.py

在par_crop阶段,只用到了.xml文件中的bndbox信息以及trackid信息。改进后将bndbox置换成自己的ground_truth就好,在.xml中,bndbox的存储顺序为[xmin,ymin,xmax,ymax],如果与自己的ground_truth不匹

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值