将数据集做成VOC2007格式用于Faster-RCNN训练

最新推荐文章于 2024-07-30 15:40:41 发布

置顶

小咸鱼_

最新推荐文章于 2024-07-30 15:40:41 发布

阅读量10w+

点赞数 82

分类专栏： Deep Learning

本文链接：https://blog.csdn.net/sinat_30071459/article/details/50723212

版权

该博客详细介绍了如何将数据集转化为VOC2007格式，以便用于Faster R-CNN的目标检测训练。步骤包括设定文件夹名，规范图片命名，绘制目标边界框，创建XML文件，将XML保存到Annotations目录，以及整理训练图片到JPEGImages文件夹，并更新ImageSetsMain的txt文件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0.文件夹名

首先，确定你的数据集所放的文件夹名字，例如我的叫logos。

（或者和voc2007一样的名字：VOC2007）

1.图片命名

虽然说图片名对训练没什么影响，但建议还是按VOC2007那样，如“000005.jpg”这种形式。至于图片格式，代码里是写的jpg。

批量修改图片名字为VOC2007格式可以参考以下Matlab代码：

%%
%图片保存路径为：
%E:\image\car
%E:\image\person
%car和person是保存车和行人的文件夹
%这些文件夹还可以有多个，
%放在image文件夹里就行
%该代码的作用是将图片名字改成000123.jpg这种形式
%%
clc;
clear;

maindir='E:\image\';
name_long=5; %图片名字的长度，如000123.jpg为6,最多9位,可修改
num_begin=1; %图像命名开始的数字如000123.jpg开始的话就是123

subdir = dir(maindir);
n=1;

for i = 1:length(subdir)
  if ~strcmp(subdir(i).name ,'.') && ~strcmp(subdir(i).name,'..')
     subsubdir = dir(strcat(maindir,subdir(i).name));
    for j=1:length(subsubdir)
         if ~strcmp(subsubdir(j).name ,'.') && ~strcmp(subsubdir(j).name,'..')
            img=imread([maindir,subdir(i).name,'\',subsubdir(j).name]);
            imshow(img);
            str=num2str(num_begin,'%09d');
            newname=strcat(str,'.jpg');
            newname=newname(end-(name_long+3):end);
            system(['rename ' [maindir,subdir(i).name,'\',subsubdir(j).name] ' ' newname]);
            num_begin=num_begin+1;
            fprintf('当前处理文件夹%s',subdir(i).name);
            fprintf('已经处理%d张图片\n',n);
            n=n+1;
           pause(0.1);%可以将暂停去掉
         end
    end
  end
end

图片名如果比较特殊或者像1(1).jpg等这类可能无法重命名，可以使用imwrite，如：

imwrite(img,strcat(save_path,newname));%改名后保存到另一文件夹，原图片不变

也可以使用Total Commander来批量重命名，非常方便，推荐使用这个工具。

下载地址：

最低0.47元/天解锁文章