数据增广 | 原图和labelimg标签同时增加——适用于目标检测任务

      针对目标检测任务,对训练数据做旋转进而达到数据增广的python2代码。

另外附上一份,检查旋转后效果的Python代码(读取annotations中xml,画图的代码),在最下面

# -*- coding:utf-8 -*-
# !/usr/bin/env python
 
import os
import cv2
import xml.dom.minidom
from xml.dom.minidom import Document  
import math
 
#获取路径下所有文件的完整路径,用于读取文件用
def GetFileFromThisRootDir(dir,ext = None):
  allfiles = []
  needExtFilter = (ext != None)
  for root,dirs,files in os.walk(dir):
    for filespath in files:
      filepath = os.path.join(root, filespath)
      extension = os.path.splitext(filepath)[1][1:]
      if needExtFilter and extension in ext:
        allfiles.append(filepath)
      elif not needExtFilter:
        allfiles.append(filepath)
  return allfiles
#图像旋转用,里面的angle是角度制的
def im_rotate(im,angle,center = None,scale = 1.0):
    h,w = im.shape[:2]
    if center is None:
        center = (w/2,h/2)
    M = cv2.getRotationMatrix2D(center,angle,scale)
    im_rot = cv2.warpAffine(im,M,(w,h))
    return im_rot
 
#读取xml文件,xmlfile参数表示xml的路径 
def readXml(xmlfile):
    DomTree = xml.dom.minidom.parse(xmlfile)  
    annotation = DomTree.documentElement  
    sizelist = annotation.getElementsByTagName('size') #[<DOM Element: filename at 0x381f788>]  
    heights = sizelist[0].getElementsByTagName('height')
    height = int(heights[0].childNodes[0].data)
    widths =sizelist[0].getElementsByTagName('width')
    width = int(widths[0].childNodes[0].data)
    depths = sizelist[0].getElementsByTagName('depth')
    depth = int(depths[0].childNodes[0].data)
    objectlist = annotation.getElementsByTagName('object')        
    bboxes = []
    for objects in objectlist:  
        namelist = objects.getElementsByTagName('name')  
        class_label = namelist[0].childNodes[0].data  
        bndbox = objects.getElementsByTagName('bndbox')[0]     
        x1_list = bndbox.getElementsByTagName('xmin')  
        x1 = int(float(x1_list[0].childNodes[0].data))  
        y1_list = bndbox.getElementsByTagName('ymin') 
        y1 = int(float(y1_list[0].childNodes[0].data)) 
        x2_list = bndbox.getElementsByTagName('xmax')  
        x2 = int(float(x2_list[0].childNodes[0].data))  
        y2_list = bndbox.getElementsByTagName('ymax')  
        y2 = int(float(y2_list[0].childNodes[0].data))
        #这里我box的格式【xmin,ymin,xmax,ymax,classname】
        bbox = [x1,y1,x2,y2,class_label]
        bboxes.append(bbox)
    return bboxes,width,height,depth
     
#写xml文件,参数中tmp表示路径,imgname是文件名(没有尾缀)ps有尾缀也无所谓
def writeXml(tmp, imgname, w, h, d, bboxes):  
    doc = Document()  
    #owner  
    annotation = doc.createElement('annotation')  
    doc.appendChild(annotation)  
    #owner  
    folder = doc.createElement('folder')  
    annotation.appendChild(folder)  
    folder_txt = doc.createTextNode("VOC2007")  
    folder.appendChild(folder_txt)  
  
    filename = doc.createElement('filename')  
    annotation.appendChild(filename)  
    filename_txt = doc.createTextNode(imgname)  
    filename.appendChild(filename_txt)  
    #ones#  
    source = doc.createElement('source')  
    annotation.appendChild(source)  
  
    database = doc.createElement('database')  
    source.appendChild(database)  
    database_txt = doc.createTextNode("My Database")  
    database.appendChild(database_txt)  
  
    annotation_new = doc.createElement('annotation')  
    source.appendChild(annotation_new)  
    annotation_new_txt = doc.createTextNode("VOC2007")  
    annotation_new.appendChild(annotation_new_txt)  
  
    image = doc.createElement('image')  
    source.appendChild(image)  
    image_txt = doc.createTextNode("flickr")  
    image.appendChild(image_txt) 
    #owner
    owner = doc.createElement('owner')  
    annotation.appendChild(owner)  
  
    flickrid = doc.createElement('flickrid')  
    owner.appendChild(flickrid)  
    flickrid_txt = doc.createTextNode("NULL")  
    flickrid.appendChild(flickrid_txt) 
    
    ow_name = doc.createElement('name')  
    owner.appendChild(ow_name)  
    ow_name_txt = doc.createTextNode("idannel")  
    ow_name.appendChild(ow_name_txt)
    #onee#  
    #twos#  
    size = doc.createElement('size')  
    annotation.appendChild(size)  
  
    width = doc.createElement('width')  
    size.appendChild(width)  
    width_txt = doc.createTextNode(str(w))  
    width.appendChild(width_txt)  
  
    height = doc.createElement('height')  
    size.appendChild(height)  
    height_txt = doc.createTextNode(str(h))  
    height.appendChild(height_txt)  
  
    depth = doc.createElement('depth')  
    size.appendChild(depth)  
    depth_txt = doc.createTextNode(str(d))  
    depth.appendChild(depth_txt)  
    #twoe#  
    segmented = doc.createElement('segmented')  
    annotation.appendChild(segmented)  
    segmented_txt = doc.createTextNode("0")  
    segmented.appendChild(segmented_txt)  
  
    for bbox in bboxes:
        #threes#  
        object_new = doc.createElement("object")  
        annotation.appendChild(object_new)  
        
        name = doc.createElement('name')  
        object_new.appendChild(name)  
        name_txt = doc.createTextNode(str(bbox[4]))  
        name.appendChild(name_txt)  
  
        pose = doc.createElement('pose')  
        object_new.appendChild(pose)  
        pose_txt = doc.createTextNode("Unspecified")  
        pose.appendChild(pose_txt)  
  
        truncated = doc.createElement('truncated')  
        object_new.appendChild(truncated)  
        truncated_txt = doc.createTextNode("0")  
        truncated.appendChild(truncated_txt)  
  
        difficult = doc.createElement('difficult')  
        object_new.appendChild(difficult)  
        difficult_txt = doc.createTextNode("0")  
        difficult.appendChild(difficult_txt)  
        #threes-1#  
        bndbox = doc.createElement('bndbox')  
        object_new.appendChild(bndbox)  
  
        xmin = doc.createElement('xmin')  
        bndbox.appendChild(xmin)  
        xmin_txt = doc.createTextNode(str(bbox[0]))
        xmin.appendChild(xmin_txt)  
  
        ymin = doc.createElement('ymin')  
        bndbox.appendChild(ymin)  
        ymin_txt = doc.createTextNode(str(bbox[1]))
        ymin.appendChild(ymin_txt)    
  
        xmax = doc.createElement('xmax')  
        bndbox.appendChild(xmax)  
        xmax_txt = doc.createTextNode(str(bbox[2]))
        xmax.appendChild(xmax_txt)  
        
        ymax = doc.createElement('ymax')  
        bndbox.appendChild(ymax)  
        ymax_txt = doc.createTextNode(str(bbox[3]))
        ymax.appendChild(ymax_txt)  
 
    tempfile = tmp +"%s.xml"%imgname  
    with open(tempfile, 'w') as f:
        f.write(doc.toprettyxml(indent='\t', encoding='utf-8'))
    return  
 
#voc路径
root = '/home/ygx/cascade-rcnn/data/VOCdevkit_car/VOC2007/10602+36000/'
img_dir = root + 'JPEGImages/'
anno_path = root + 'Annotations/' 
#存储新的anno位置
anno_new_path = root + 'NewAnnotations/' 
if not os.path.isdir(anno_new_path):
    os.makedirs(anno_new_path)
#读取原图全路径  
imgs_path=GetFileFromThisRootDir(img_dir)
#存储旋转后图片位置
pro_dir = root+'train_translate_scale_rotate/'
if not os.path.isdir(pro_dir):
    os.makedirs(pro_dir)
#旋转角的大小,整数表示逆时针旋转
angles = [1,359]#角度im_rotate用到的是角度制
angle_rad = [angle*math.pi/180.0 for angle in angles] #cos三角函数里要用到弧度制的    
j=0 # 计数用
angle_num = len(angles)
for img_path in imgs_path :
    #读取原图像
    im = cv2.imread(img_path)
    for i in range(angle_num):
        gt_new = []
        im_rot = im_rotate(im,angles[i])
        file_name = img_path.split('/')[-1][:-4]
        #画出旋转后图像
        cv2.imwrite(os.path.join(pro_dir,'P%s_%s.jpg'%(angles[i],file_name)),im_rot)
        anno = os.path.join(anno_path,'%s.xml'%file_name)
        #读取anno标签数据
        [gts,w,h,d] =readXml(anno) 
        #计算旋转后gt框四点的坐标变换
        [xc,yc] = [float(w)/2,float(h)/2]
        for gt in gts:
            #计算左上角点的变换
            x1 = (gt[0]-xc)*math.cos(angle_rad[i]) - (yc-gt[1])*math.sin(angle_rad[i]) + xc
            if x1<0 : x1=0
            if x1>w-1 : x1=w-1                        
            y1 = yc - (gt[0]-xc)*math.sin(angle_rad[i]) - (yc-gt[1])*math.cos(angle_rad[i]) 
            if y1<0 : y1=0         
            if y1>h-1 : y1=h-1 
            #计算右上角点的变换   
            x2 = (gt[2]-xc)*math.cos(angle_rad[i]) - (yc-gt[1])*math.sin(angle_rad[i]) + xc
            if x2<0 : x2=0
            if x2>w-1 : x2=w-1                        
            y2 = yc - (gt[2]-xc)*math.sin(angle_rad[i]) - (yc-gt[1])*math.cos(angle_rad[i])
            if y2<0 : y2=0         
            if y2>h-1 : y2=h-1 
            #计算左下角点的变换
            x3 = (gt[0]-xc)*math.cos(angle_rad[i]) - (yc-gt[3])*math.sin(angle_rad[i]) + xc
            if x3<0 : x3=0
            if x3>w-1 : x3=w-1                        
            y3 = yc - (gt[0]-xc)*math.sin(angle_rad[i]) - (yc-gt[3])*math.cos(angle_rad[i])
            if y3<0 : y3=0         
            if y3>h-1 : y3=h-1
            #计算右下角点的变换
            x4 = (gt[2]-xc)*math.cos(angle_rad[i]) - (yc-gt[3])*math.sin(angle_rad[i]) + xc
            if x4<0 : x4=0          
            if x4>w-1 : x4=w-1
            y4 = yc - (gt[2]-xc)*math.sin(angle_rad[i]) - (yc-gt[3])*math.cos(angle_rad[i])
            if y4<0 :y4=0      
            if y4>h-1 : y4=h-1
            xmin = min(x1,x2,x3,x4)
            xmax = max(x1,x2,x3,x4)
            ymin = min(y1,y2,y3,y4)
            ymax = max(y1,y2,y3,y4)
            #把因为旋转导致的特别小的 长线型的去掉
            w_new = xmax-xmin+1
            h_new = ymax-ymin+1
            ratio1 = float(w_new)/h_new
            ratio2 = float(h_new)/w_new
            if(1.0/6.0<ratio1<6 and 1.0/6.0<ratio2<6 and w_new>9 and h_new>9):
                classname = str(gt[4])
                gt_new.append([xmin,ymin,xmax,ymax,classname])
            #写出新的xml
            writeXml(anno_new_path,'P%s_%s'%(angles[i],file_name) , w, h, d, gt_new)
    j = j+1
    if j%100==0 : print '----%s----'%j
   
 
    

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Tue Jul 18 11:07:38 2017
@author: cetc_ic
"""
 
from __future__ import division  
import os   
import xml.dom.minidom  
import cv2
  
root='/home/ygx/cascade-rcnn/data/VOCdevkit_car/VOC2007/'
#ImgPath = root+'JPEGImages'   
#AnnoPath = root+'Annotations'  
#ProcessedPath = root+'gt_show'
 
ImgPath = root+'train_translate_scale_rotate'   
AnnoPath = root+'NewAnnotations'  
ProcessedPath = root+'gt_show_rotate'
 
 
if not os.path.exists(ProcessedPath):  
    os.makedirs(ProcessedPath)  
  
label_list = os.listdir(AnnoPath)  
 
num = 0
 
for labelfile in label_list:
    xmlfile = os.path.join(AnnoPath,labelfile)
    imgfile = os.path.join(ImgPath,'%s.jpg' % labelfile[:-4])   
    
    DomTree = xml.dom.minidom.parse(xmlfile)  
    annotation = DomTree.documentElement  
 
#    filenamelist = annotation.getElementsByTagName('filename') #[<DOM Element: filename at 0x381f788>]  
#    filename = filenamelist[0].childNodes[0].data  
    objectlist = annotation.getElementsByTagName('object')        
    bboxes = []
    for objects in objectlist:  
        namelist = objects.getElementsByTagName('name')  
        class_label = namelist[0].childNodes[0].data  
 
        bndbox = objects.getElementsByTagName('bndbox')[0]
        
        x1_list = bndbox.getElementsByTagName('xmin')  
        x1 = int(float(x1_list[0].childNodes[0].data))
        y1_list = bndbox.getElementsByTagName('ymin')  
        y1 = int(float(y1_list[0].childNodes[0].data)) 
        x2_list = bndbox.getElementsByTagName('xmax')  
        x2 = int(float(x2_list[0].childNodes[0].data))
        y2_list = bndbox.getElementsByTagName('ymax')  
        y2 = int(float(y2_list[0].childNodes[0].data))
        
        bbox = [x1,y1,x2,y2,class_label]
        bboxes.append(bbox)
    
    img = cv2.imread(imgfile)
    for bbox in bboxes:
        x1 = bbox[0]
        y1 = bbox[1]
        x2 = bbox[2]
        y2 = bbox[3]
        
        if x1 < 0 : x1 = 0
        if y1 < 0 : y1 = 0
        if x2 > img.shape[1] - 1 : x2 = img.shape[1] - 1
        if y2 > img.shape[0] - 1 : y2 = img.shape[0] - 1
        
        cv2.rectangle(img,(x1,y1),(x2,y2),(255,255,0),2)
        #cv2.putText(img,bbox[4],(bbox[0],bbox[1]),0.6,cv2.FONT_HERSHEY_SIMPLEX,2)
    cv2.imwrite(os.path.join(ProcessedPath,'%s.jpg' % labelfile[:-4]),img)
    print labelfile
 
    num += 1
    print num

 

参考:https://blog.csdn.net/e01528/article/details/80685978

 

  • 4
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: labelimg是一款用于图像标注的工具,可以实现对车牌的标注。在使用labelimg标注车牌时,需要先将车牌图像导入该工具,然后选取“框选工具”或“多边形工具”对车牌进行标注。在选取工具后,就可以在车牌图像上进行标注,将车牌的位置和轮廓用矩形或多边形框住。标注完成后,将标注好的车牌信息导出保存为xml或txt格式,即可应用于车牌识别中。 车牌识别是一种基于计算机视觉的技术,通过图像处理和模式识别等方法,实现对车牌字符的识别和提取。标注车牌是车牌识别的前置工作,是实现自动识别的必要条件。因为车牌的形状、颜色和字体等特征都具有复杂性和多样性,所以需要采用有效的标注工具和标注方法,保证标注的准确性和效率。labelimg是一款很好用的图像标注工具,能够有效满足车牌标注的需求,是车牌识别技术的重要工具之一。 ### 回答2: labelimg是一款非常优秀的图像标注工具,可以用于标注车牌等各种物体。在标注车牌时,一般需要按照以下步骤进行: 首先,在labelimg中载入待标注的图片。可以通过在工具栏中打开“Open Dir”来选择需要标注的文件夹,或者直接拖拽图片文件到工作区域来加载。 然后,使用鼠标框选出车牌区域,并在工具栏中选择“Create RectBox”来创建一个矩形框,将这个矩形框调整到车牌区域并进行细微调整。 接着,对车牌区域进行标注。在工具栏中选择“Create Main Label”来创建一个主要的标注,例如“车牌”、“LP”等,然后在相应的矩形框内输入车牌的具体信息。 最后,保存标注结果。可以在工具栏中选择“Save”来保存标注结果,或者选择“Next Image”来标注下一张图片。 通过以上步骤,就可以用labelimg快速、准确地标注车牌,为后续的图像处理、识别等工作提供便利。同时,labelimg本身还具备多种高级功能,例如多标签支持、图像增强、导出标注结果等,能够满足各种场景下的需求。 ### 回答3: labelimg是一个图像标注工具,可以用户在图片中标注物件。对于车牌这种需要精确标注的物件,在图像识别领域也是一个广泛应用的场景。使用labelimg可以通过在图片中框出车牌区域并进行标注,来训练出一个能够识别车牌的模型。车牌的标注包括车牌的位置、大小、颜色、文字等信息。标注的精度和质量对于训练模型的效果至关重要。 使用labelimg标注车牌时,需要对车牌进行初步的分析和提取。这一过程可以采用数字图像处理技术,通过提取图像颜色、形状和纹理等特征来识别出可能的车牌区域。然后借助labelimg工具可以将车牌框出并标注。标注车牌时,需要考虑车牌旋转、遮挡等情况,以提升模型对不同场景的适应性。 标注完车牌后,可以使用深度学习算法进行训练,通过大量的车牌数据和标注集,训练出精准识别车牌的模型。识别车牌在实际应用中可以用于车辆安全管理、交通违章监测、物流配送等方面,有着广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值