OTB数据集和VOT数据集融合跟踪算法接口示例

最新推荐文章于 2024-09-20 21:18:45 发布

博博有个大大大的Dream

最新推荐文章于 2024-09-20 21:18:45 发布

阅读量9.5k

点赞数 8

分类专栏：目标跟踪文章标签： OTB数据集 VOT数据集算法接口

本文链接：https://blog.csdn.net/qq_17783559/article/details/90485701

版权

目标跟踪专栏收录该内容

56 篇文章 83 订阅

订阅专栏

OTB数据集和VOT数据集自己存数据接口参考代码：

一、OTB数据集（不使用tracker_benchmark_v1.0）

1、OTB数据结果最基本的格式

type为目标框类型；

res为目标框的所在位置；

fps为跟踪算法的速度；

len为帧数；

startFrame为开始帧的值；

annoBegin为具有groundtruth真实值开始的帧数；

annoBegin与startFrame一般相同。

2、results.res数据格式

results.res表示目标框格式为：

四个值的分别表示(X,Y,W,H)，他们的位置关系如图所示：

groundtruth的值也和 results.res格式一样。

3、保存数据代码

这个代码用groundtruth为例，数据集选择的是OTB-2013.

有三个需要注意的地方：

1）Jogging和Skating2具有两个跟踪目标需要区分；

2）David，Football1，Freeman3，Freeman4并非第一帧开始最后一帧结束；

3）Tiger1的首5帧目标被遮挡需要去掉，原benchmark中也是去掉了的。

clear;clc;
close all;
% 数据集路径路径
base_path  = 'D:\Datasets\OTB100\';
% 视频序列
% videos = {'Basketball'};
videos = {'Soccer', 'Matrix', 'Ironman', 'Deer', 'Skating1', 'Shaking', ...
    'Singer1', 'Singer2', 'CarDark', 'Car4', 'David2', 'Sylvester', 'Trellis', ...
    'Fish', 'Mhyang', 'David', 'Coke', 'Bolt', 'Boy', 'Dudek', ...
    'Crossing', 'Couple', 'Football1', 'Jogging-1', 'Jogging-2', 'Doll', ...
    'Girl', 'Walking2', 'Walking', 'Fleetface', 'Freeman1', 'Freeman3', ...
    'Freeman4', 'David3', 'Jumping', 'CarScale', 'Skiing', 'Dog1',...
    'Suv', 'MotorRolling', 'MountainBike', 'Lemming', 'Liquor', 'Woman', 'Faceocc1', ...
    'Faceocc2', 'Basketball', 'Football', 'Subway', 'Tiger1', 'Tiger2'};
% 跟踪器名字
tracker='GT';
% 保存路径
savePath='./results/';

for vid = 1:numel(videos)
    close all;
    disp(videos{vid});
    
    % 两个视频序列具有两个groundtruth
    if (strcmp(videos{vid}, 'Jogging-1'))
        video_path = [base_path '/' 'Jogging'];
        [seq, ground_truth] = load_video_info(video_path,1);
    elseif (strcmp(videos{vid}, 'Jogging-2'))
        video_path = [base_path '/' 'Jogging'];
        [seq, ground_truth] = load_video_info(video_path,2);
    elseif (strcmp(videos{vid}, 'Skating2-1'))
        video_path = [base_path '/' 'Skating2'];
        [seq, ground_truth] = load_video_info(video_path,1);
    elseif (strcmp(videos{vid}, 'Skating2-2'))
        video_path = [base_path '/' 'Skating2'];
        [seq, ground_truth] = load_video_info(video_path,2);
    else
        video_path = [base_path '/' videos{vid}];
        [seq, ground_truth] = load_video_info(video_path,0);
    end
    
    % 四个视频并非从第一帧开始，最后一帧结束
    seq.VidName = videos{vid};
    st_frame = 1;
    en_frame = seq.len;
    if (strcmp(videos{vid}, 'David'))
        st_frame = 300;
        en_frame = 770;
    elseif (strcmp(videos{vid}, 'Football1'))
        st_frame = 1;
        en_frame = 74;
    elseif (strcmp(videos{vid}, 'Freeman3'))
        st_frame = 1;
        en_frame = 460;
    elseif (strcmp(videos{vid}, 'Freeman4'))
        st_frame = 1;
        en_frame = 283;
    end
    seq.st_frame = st_frame;
    seq.en_frame = en_frame;
    
    % 帧数
    num_frames=en_frame-st_frame+1;
    % 预声明目标框
    rect_position = zeros(num_frames, 4);
    % 初始化目标框
    rect_position(1,:)=ground_truth(1,:);
    % 初始化时间
    time = 0;
    % 从第二帧开始检测
    for frame=st_frame+1:en_frame
        % 开始计时
        tic();
        % 跟踪代码，这里直接用groundtruth为例，从第二帧开始
        rect_position(frame-st_frame+1,:)=ground_truth(frame-st_frame+1,:);
        % 计算时间
        time = time + toc();
    end
    
    % 原始数据集中，Tiger1的前5帧都是有遮挡的，所以需要直接去掉
    if (strcmp(videos{vid}, 'Tiger1'))
        rect_position=rect_position(6:en_frame,:);
        st_frame1=st_frame+5;
        num_frames=num_frames-5;
    else
        st_frame1=st_frame;
    end
    %   save resutls.
    fps = (en_frame-st_frame) / time;
    results{1}.type = 'rect';
    results{1}.res = rect_position;
    results{1}.fps = fps;
    results{1}.len = num_frames;
    results{1}.annoBegin = st_frame;
    results{1}.startFrame = st_frame1;
    save([savePath videos{vid} '_' tracker '.mat'], 'results');
end

4、运行后保存结果如图：

5、将结果拷贝到benchmark中，运行perfPlot.m。

6、运行 drawResultBB.m

7、工程代码下载地址：

SaveOTBresults.zip_BACFresults-机器学习代码类资源-CSDN下载

二、VOT数据集（不使用vot-toolkit工具）

说明：VOT数据集使用trax来运行跟踪代码，贼麻烦还总容易出错，这里使用matlab自己生成分析文件。

1、VOT的groundtruth格式如下：

每帧有八个数据，分别表示目标框四边形的四个顶点如下图蓝色框所示：（x1,y1）、（x2,y2）、（x3,y3）、（x4,y4）。

在我们跟踪过程中将其转化为黑色的矩形框表示为：（x,y,width, height）。

2、VOT实验分析

默认vot-toolkit工具的实验，分为两个部分：

baseline实验是为了分析{'ar', 'expected_overlap', 'speed'}这三个指标。

unsupervised实验是为了分析{'overlap', 'speed'}这两个指标。

1）baseline参数详细解释

baseline.parameters.repetitions = 15;

对每个序列进行多次评估，以获得更好的统计性能。如果跟踪器连续产生两次相同的轨迹，则跟踪器被认为是确定性的，并且省略了进一步的迭代。此处设置重复运行15次，一般最后我们的结果会保存三次，都是一模一样的。

baseline.parameters.burnin = 10;

baseline.parameters.skip_initialize = 5;

baseline.parameters.failure_overlap = 0;

在VOT提出之前，比较流行的评价系统是让tracker在序列的第一帧进行初始化，之后让tracker一直跑到最后一帧。然而tracker可能会因为其中一两个因素导致其在开始的某些帧就跟丢（fail），所以最终评价系统只利用了序列的很小一部分，造成浪费。而VOT提出，评价系统应该在tracker跟丢的时候检测到错误（failure），并在failure发生的5帧之后对tracker重新初始化（reinitialize），这样可以充分利用数据集。之所以是5帧而不是立即初始化，是因为failure之后立即初始化很可能再次跟踪失败，又因为视频中的遮挡一般不会超过5帧，所以会有这样的设定。这是VOT的一个特色机制，即重启（reset/reinitialize）。但重启之后的一部分帧是不能用于评价的，这些帧被称作burn-in period，大量实验结果表明，burn-in period大约为初始化之后（包括第一帧的初始化和所有重启）的10帧。
这段原文：https://blog.csdn.net/Dr_destiny/article/details/80108255

所以这也能够解释baseline实验是监督属性的，因为我们需要已经知道了groundtruth的labels，我们才能够实施重启机制。当平均重叠度为零时，VOT重启机制开启，这是VOT作者给的检测重启示意图：

注意：原始工程的计算重叠度公式在\vot-toolkit-master\native\trax\src\region.c中，本文对其进行仿写。

2）unsupervised参数详细解释

无监督方式就是我们不知道groundtruth，所以通过第一帧给定的目标框跟踪就可以了。

3、csr-dcf示例代码

此处以csr-dcf为例，也可以用其他的代码，按照格式稍微改一改就好了。csr-dcf代码的配置见博客：CVPR2017跟踪算法CSR-DCF的配置（Discriminative Correlation Filter with Channel and Spatial Reliability）_博博有个大大大的Dream-CSDN博客

1）baseline实验代码：

细节介绍：通过compute_polygon_overlap函数计算跟踪结果与groundtruth的重叠度，如果重叠度为零，则重新初始化。这里的重叠度计算函数和vot-toolkit工具中的计算方法是一样的。

本来需要运行至少三次，因为三次的数据除了FPS都是一样的，为了简化我们只运行一次，第二第三次的数据是copy产生的。

    %---------------------------------------------------------
    % baseline 实验
    %---------------------------------------------------------
    startframe=1;
    finishflag=0;
    % 预声明目标框
    rect_positionb = cell(num_frames,1);
    rect_positionb{1}=1;
    while(1)
        % 初始化
        tic();
        % 读取第一帧
        image = imread([sequence_path '/' img_files{startframe}]);
        [w,h,~]=size(image);
        % 读取groundtruth
        region=ground_truth(startframe,:);
        if numel(region) > 4
        % all x,y points shifted by 1
            region = region + 1;
        else
            % shift x,y by 1
            region(1:2) = region(1:2) + 1;
        end
        % 初始化
        [tracker, ~] = create_csr_tracker(image, region);
        % 记录初始化时间
        timeb(startframe,1:3) = toc();
        % 从第二帧开始检测
        for frame=startframe+1:num_frames
            % 开始计时
            tic();
            % 跟踪代码，从第二帧开始
            image = imread([sequence_path '/' img_files{frame}]);
            [tracker, region] = track_csr_tracker(tracker, image);

            % matlab indexing: starts with (1,1); gt starts with (0,0)
            if numel(region) > 4
                % all x,y points shifted by 1
                region = region - 1;
            else
                % shift x,y by 1
                region(1:2) = region(1:2) - 1;
            end
            % 计算时间
            timeb(frame,1:3) = toc();   
            % 计算重叠度
            OP=compute_polygon_overlap(ground_truth(frame,:),double(region),double([0,0,h,w]));
            if OP==0
                if num_frames-frame>4
                    rect_positionb{frame}=2;
                    zero4 = num2cell(zeros(4,1));
                    rect_positionb(frame+1:frame+4,1)=zero4;
                    timeb(frame+1:frame+4,1:3) = 0/0;% 生成Nan
                    rect_positionb{frame+5}=1;
                    startframe=frame+5;
                    break;
                else
                    rect_positionb{frame}=2;
                    zeron = num2cell(zeros(num_frames-frame,1));
                    rect_positionb(frame+1:num_frames,1)=zeron;
                    timeb(frame+1:num_frames,1:3) = 0/0;% 生成Nan
                    finishflag=1;
                    break;
                end
            else
                rect_positionb{frame}=double(region);
            end
        end
        if (finishflag==1)||(frame==num_frames)
            break;
        end
    end
    
    % Save Data
    baselinepath=[savePath trackerName '/baseline/' videos{vid}];
    mkdir(baselinepath);
    dlmwrite([baselinepath '/' videos{vid} '_001.txt'], rect_positionb{1},'newline','pc');
    dlmwrite([baselinepath '/' videos{vid} '_002.txt'], rect_positionb{1},'newline','pc');
    dlmwrite([baselinepath '/' videos{vid} '_003.txt'], rect_positionb{1},'newline','pc');
    for fid=2:num_frames
        dlmwrite([baselinepath '/' videos{vid} '_001.txt'], rect_positionb{fid},'-append','newline','pc');
        dlmwrite([baselinepath '/' videos{vid} '_002.txt'], rect_positionb{fid},'-append','newline','pc');
        dlmwrite([baselinepath '/' videos{vid} '_003.txt'], rect_positionb{fid},'-append','newline','pc');
    end
    dlmwrite([baselinepath '/' videos{vid} '_time.txt'], timeb,'newline','pc', 'precision',5);

2）unsupervised实验代码：

细节介绍：通过第一帧初始化，跟踪到最后一帧。

    %---------------------------------------------------------
    % unsupervised 实验
    %---------------------------------------------------------    
    % 预声明目标框
    rect_positionu = cell(num_frames,1);
    rect_positionu{1}=1;
    % 初始化
    tic();
    % 读取第一帧
    image = imread([sequence_path '/' img_files{1}]);
    % 读取groundtruth
    region=ground_truth(1,:);
    if numel(region) > 4
        % all x,y points shifted by 1
        region = region + 1;
    else
        % shift x,y by 1
        region(1:2) = region(1:2) + 1;
    end
    % 初始化
    [tracker, ~] = create_csr_tracker(image, region);
    % 记录初始化时间
    timeu(1) = toc();
    % 从第二帧开始检测
    for frame=2:num_frames
        % 开始计时
        tic();
        % 跟踪代码，从第二帧开始
        image = imread([sequence_path '/' img_files{frame}]);
        [tracker, region] = track_csr_tracker(tracker, image);
        % matlab indexing: starts with (1,1); gt starts with (0,0)
        if numel(region) > 4
            % all x,y points shifted by 1
            region = region - 1;
        else
            % shift x,y by 1
            region(1:2) = region(1:2) - 1;
        end
        % 计算时间
        timeu(frame) = toc();
        rect_positionu{frame}=double(region);
    end
    
    % Save Data
    unsupervisedpath=[savePath trackerName '/unsupervised/' videos{vid}];
    mkdir(unsupervisedpath);
    dlmwrite([unsupervisedpath '/' videos{vid} '_001.txt'], rect_positionu{1},'newline','pc');
    for fid=2:num_frames
        dlmwrite([unsupervisedpath '/' videos{vid} '_001.txt'], rect_positionu{fid},'-append','newline','pc');
    end
    dlmwrite([unsupervisedpath '/' videos{vid} '_time.txt'], timeu,'newline','pc', 'precision',5);

完整工程见文末。

4、运行SaveVOTresults.m得到结果

5、速度归一化

目标跟踪的每篇文章提出的算法都是在不同硬件条件平台上跑的，编程语言也不尽相同，那么该如何对这些算法的实时性进行客观评价？VOT采用的评价标准是：EFO。

EFO（Equivalent Filter Operations ）是VOT2014提出来的一个衡量tracking速度的新单位，在利用vot-toolkit评价tracker之前，先会测量在一个600*600的灰度图像上用30*30最大值滤波器进行滤波的时间，以此得出一个基准单位，再以这个基础单位衡量tracker的速度，以此减少硬件平台和编程语言等外在因素对tracker速度的影响。
这段原文：https://blog.csdn.net/Dr_destiny/article/details/80108255。

运行代码tracker\benchmark_hardware.m会得到一个电脑的配置文件，生成路径：\vot-toolkit-master\cache\performance.txt。

为了得到更大的EFO，运行benchmark_hardware.m的时候记得把英雄联盟打开，嘿嘿嘿嘿嘿。

硬件参数如下：