FasterRCNN画框小程序——VOC2007格式(python)

本文介绍了一种利用Python编写小程序的方法,来快速标注Faster R-CNN训练所需的数据。针对二值图像,通过查找像素值为255的区域,确定(x_min, y_min, x_max, y_max)坐标,并更新VOC2007格式的XML文件。作者在不足24小时的Python学习时间内完成了这个程序的编写,期待良好的标注效果。" 126326705,9349560,DaVinci Developer工具导入AUTOSAR XML实战,"['Davinci Dev', 'AutoSAR', 'XML工具', '系统描述']
摘要由CSDN通过智能技术生成

用Faster RCNN训练数据,手动标注好辛苦,好在我的数据是二值的,找到对应的像素值为255的(x_min,y_min,x_max,y_max)然后替换xml中的对应值就好了

首先要有一个VOC2007格式的xml文件,在这个基础上进行修改

学python的日子加起来不超过24小时,编这个小程序花了一天的时间,希望有个好结果。加油

# get the gt's x_min,y_min,x_max,y_max and replace the xml's values
# first traverse the image to find the pixel==255's position
# second find the x_min,y_min,x_max,y_max
# third read the xml file and replace the values
# by LYS 6/28/2017 
from PIL import Image,ImageDraw
import xml.etree.cElementTree as ET
import os

# according to the image's path to locate the position
def get_positions(image_path):
    im = Image.open(image_path).convert('L')#open the image and convert to gray image
    draw = ImageDraw.Draw(im)
    width = im.size[0]
    height = im.size[1]
    x = []
    y = []
    for w in range(0, width):
        for h in range(0, height):
	    pixel &
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值