Pysot训练自己数据集前的预处理

Vesper0412

已于 2022-04-19 16:09:50 修改

阅读量2.6k

点赞数 2

分类专栏： Pysot相关文章标签：计算机视觉神经网络深度学习目标跟踪

于 2022-04-18 17:20:55 首次发布

本文链接：https://blog.csdn.net/qq_40313336/article/details/124253759

版权

本文介绍了如何使用Pysot对自定义视频数据集进行预处理，包括par_crop.py、parse_vid.py和gen_json.py三个步骤。针对.txt格式的ground_truth，调整了bndbox信息，并详细说明了json文件的生成过程，确保训练时数据路径的正确性。

摘要由CSDN通过智能技术生成

预处理后的训练：

Pysot训练自己的数据集_Vesper0412的博客-CSDN博客

Pysot源码地址： GitHub - STVIR/pysot: SenseTime Research platform for single object tracking, implementing algorithms like SiamRPN and SiamMask.

因为我用的数据集是视频数据集，所以比照着Pysot中使用的VID数据集进行预处理。

VID数据集的标签是以.xml格式存储的，具体如下：

<?xml version="1.0"?>
<annotation>
    <folder>ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000</folder>
    <filename>000000</filename>
    <source>
        <database>ILSVRC_2015</database>
    </source>
    <size>
        <width>1280</width>
        <height>720</height>
    </size>
    <object>
        <trackid>0</trackid>
        <name>n01674464</name>
        <bndbox>
            <xmax>1050</xmax>
            <xmin>323</xmin>
            <ymax>428</ymax>
            <ymin>216</ymin>
        </bndbox>
        <occluded>1</occluded>
        <generated>0</generated>
    </object>
</annotation>

但我使用数据集的ground_truth是以 ‘.txt’ 形式存储的，所以代码调整一下。