Keras---数据预处理操作

最新推荐文章于 2024-04-09 10:00:04 发布

进我的收藏吃灰吧~~

最新推荐文章于 2024-04-09 10:00:04 发布

阅读量775

点赞数 1

分类专栏： Keras 目标检测文章标签： python 计算机视觉深度学习机器学习 xml

本文链接：https://blog.csdn.net/weixin_42206075/article/details/111182492

版权

目标检测同时被 2 个专栏收录

41 篇文章 12 订阅

订阅专栏

Keras

2 篇文章 0 订阅

订阅专栏

Keras—数据预处理操作

文件格式

一般来说，目前目标检测中常用的数据集有coco数据集，voc数据集

VOC数据集是目标检测经常用的一个数据集，从05年到12年都会举办比赛（比赛有task： Classification 、Detection（将图片中所有的目标用bounding box框出来）、 Segmentation（将图片中所有的目标分割出来）、Person Layout）

VOC2007：中包含9963张标注过的图片，由train/val/test三部分组成，共标注出24,640个物体。
VOC2012：对于检测任务，VOC2012的trainval/test包含08-11年的所有对应图片。trainval有11540张图片共27450个物体。对于分割任务， VOC2012的trainval包含07-11年的所有对应图片，test只包含08-11。trainval有 2913张图片共6929个物体。

COCO数据集是微软团队获取的一个可以用来图像recognition+segmentation+captioning 数据集，这个数据集以scene understanding为目标，主要从复杂的日常场景中截取，图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标，328,000影像和2,500,000个label。

这里，只介绍voc2007数据集~
在这里插入图片描述
数据集一般是按照这样的形式来呈现的~

└── VOCdevkit #根目录
└── VOC2012 #不同年份的数据集，这里只下载了2012的，还有2007等其它年份的
├── Annotations #存放xml文件，与JPEGImages中的图片一一对应，解释图片的内容等等
├── ImageSets #该目录下存放的都是txt文件，txt文件中每一行包含一个图片的名称，末尾会加上±1表示正负样本
│ ├── Action
│ ├── Layout
│ ├── Main
│ └── Segmentation
├── JPEGImages #存放源图片
注：其实里面还有图像分割的数据，但是这里只介绍用于目标检测所需要的文件

代码实现

import os
import random 
 
xmlfilepath=r'./VOCdevkit/VOC2007/Annotations'
# saveBasePath=r"./VOCdevkit/VOC2007/ImageSets/Main/"
saveBasePath=r"./"
 
trainval_percent=1
train_percent=1

temp_xml = os.listdir(xmlfilepath)
total_xml = []
for xml in temp_xml:
    if xml.endswith(".xml"):
        total_xml.append(xml)

num=len(total_xml)  
list=range(num)  
tv=int(num*trainval_percent)  
tr=int(tv*train_percent)  
trainval= random.sample(list,tv)  
train=random.sample(trainval,tr)  
 
print("train and val size",tv)
print("traub suze",tr)
ftrainval = open(os.path.join(saveBasePath,'trainval.txt'), 'w')  
ftest = open(os.path.join(saveBasePath,'test.txt'), 'w')  
ftrain = open(os.path.join(saveBasePath,'train.txt'), 'w')  
fval = open(os.path.join(saveBasePath,'val.txt'), 'w')  
 
for i  in list:  
    name=total_xml[i][:-4]+'\n'  
    if i in trainval:  
        ftrainval.write(name)  
        if i in train:  
            ftrain.write(name)  
        else:  
            fval.write(name)  
    else:  
        ftest.write(name)  
  
ftrainval.close()  
ftrain.close()  
fval.close()  
ftest .close()

'''上面的代码的目的：提取出voc数据集中所有数据的名字'''

效果图：
在这里插入图片描述

接下来，就是解析每个XML文件~

import xml.etree.ElementTree as ET
from os import getcwd

sets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test')]

classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]


def convert_annotation(year, image_id, list_file):
    in_file = open('VOCdevkit/VOC%s/Annotations/%s.xml'%(year, image_id))
    tree=ET.parse(in_file)
    root = tree.getroot()

    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult)==1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (int(xmlbox.find('xmin').text), int(xmlbox.find('ymin').text), int(xmlbox.find('xmax').text), int(xmlbox.find('ymax').text))
        list_file.write(" " + ",".join([str(a) for a in b]) + ',' + str(cls_id))

wd = getcwd()

for year, image_set in sets:
    image_ids = open('VOCdevkit/VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()
    list_file = open('%s_%s.txt'%(year, image_set), 'w')
    for image_id in image_ids:
        list_file.write('%s/VOCdevkit/VOC%s/JPEGImages/%s.jpg'%(wd, year, image_id))
        convert_annotation(year, image_id, list_file)
        list_file.write('\n')
    list_file.close()

在这里插入图片描述
通过上述代码会生成三个文件，分别是2007_train,2007_val,2007_test文件

—红色：对应图片的位置
—黄色：对应位置人工标注真实框的左上角和右下角坐标
—蓝色：该真实框的真实类别

代码转载于：https://blog.csdn.net/weixin_44791964/article/details/105753740

进我的收藏吃灰吧~~

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
Keras---数据预处理操作

Keras—数据预处理操作文件格式一般来说，目前目标检测中常用的数据集有coco数据集，voc数据集VOC数据集是目标检测经常用的一个数据集，从05年到12年都会举办比赛（比赛有task： Classification 、Detection（将图片中所有的目标用bounding box框出来）、 Segmentation（将图片中所有的目标分割出来）、Person Layout）VOC2007：中包含9963张标注过的图片，由train/val/test三部分组成，共标注出24,640个物体
复制链接

扫一扫