Caffe-YOLOv3-Windows (一)VOC2007转化为lmdb

模型网址:GitHub - eric612/Caffe-YOLOv3-Windows: A windows caffe implementation of YOLO detection networkj

数据集制作:

先考虑使用的是官方VOC2007数据集,需要把数据集转化为适用于Caffe的lmdb格式。

我们需要的VOC数据集中的文件夹包含:

 其中,一个文件夹是原始图片,另一个文件夹是原始图片对应的包含标注信息的xml文件

 

 

接下来进入数据集的制作步骤,准备py文件:

import os
import random

trainval_percent = 0.8
train_percent = 0.8
xmlfilepath = '.VOC2007/Annotations'
txtsavepath = '.VOC2007/ImageSets/Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('./VOC2007/ImageSets/Main/trainval.txt', 'w')
ftest = open('./VOC2007/ImageSets/Main/test.txt', 'w')
ftrain = open('./VOCdevkit/VOC2007/ImageSets/Main/train.txt', 'w')
fval = open('./VOC2007/ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

使用时,把路径改成自己的,运行后在相应文件夹生成:

txt文件中是原图不带后缀的名称:

 

 在这个文件路径下创建create_list.sh文件:

#!/bin/bash

bash_dir="$(pwd)"
root_dir=.改路径/
echo $root_dir
sub_dir=ImageSets/Main
for dataset in trainval test
do
  dst_file=$bash_dir/$dataset.txt
  if [ -f $dst_file ]
  then
    rm -f $dst_file
  fi
  for name in VOC2007
  do
    echo "Create list for $name $dataset..."
    dataset_file=$root_dir/$name/$sub_dir/$dataset.txt

    img_file=$bash_dir/$dataset"_img.txt"
    cp $dataset_file $img_file
    sed -i "s/^/$name\/JPEGImages\//g" $img_file
    sed -i "s/$/.jpg/g" $img_file

    label_file=$bash_dir/$dataset"_label.txt"
    cp $dataset_file $label_file
    sed -i "s/^/$name\/Annotations\//g" $label_file
    sed -i "s/$/.xml/g" $label_file

    paste -d' ' $img_file $label_file >> $dst_file

    rm -f $label_file
    rm -f $img_file
  done

  # Generate image name and size infomation.
  if [ $dataset == "test" ]
  then
    改相应的caffe下路径/scripts/build/tools/Release/get_image_size $root_dir $dst_file $bash_dir/$dataset"_name_size.txt"
  fi

  # Shuffle trainval file.
  if [ $dataset == "trainval" ]
  then
    rand_file=$dst_file.random
    cat $dst_file | perl -MList::Util=shuffle -e 'print shuffle(<STDIN>);' > $rand_file
    mv $rand_file $dst_file
  fi
done

运行该create_list.sh文件,在文件夹中生成

其中,labelmap_voc.prototxt文件中对应的是VOC数据集类别,网上有,不赘述

txt文件中包含原图路径及对应的xml文件

 然后,在VOC2007文件夹的上一级,生成两个.sh文件,分别是train_convert_lmdb.sh和val_convert_lmdb.sh

内容如下:

caffe路径/tools/Release/convert_annoset.exe --anno_type=detection --encode_type=jpg --encoded=true  --shuffle=true --label_map_file=改路径/labelmap_voc.prototxt VOC2007路径的上一级/ 改路径/VOC2007/trainval.txt train_voc_lmdb
caffe路径/tools/Release/convert_annoset.exe --anno_type=detection --encode_type=jpg --encoded=true  --shuffle=true --label_map_file=改路径/labelmap_voc.prototxt VOC2007路径的上一级/ 改路径/VOC2007/test.txt val_voc_lmdb

运行这两个脚本文件,生成:

其中,每个文件夹中: 

注意:如果两个mdb文件大小均为8kb,说明生成错误。

另外,路径格式一定要按照本博文设置,否则可能出现正常生成lmdb文件(文件大小不是8kb),但训练出错的情况。我在这上面浪费了很久的时间,一直没发现问题所在。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值