最近在跑SSD和Faster R-CNN深度学习代码,下载了一些数据集,但是这些数据集标签文件不是xml格式文件,而是yaml文件,虽然网上有在线转化的工具,但是这种做法对我来说显然是很低效率的。为了提高效率,自己写了相关的代码。现在分享给大家。
感谢Bosch Small Traffic Lights Dataset 提供的部分代码。
以下是label_images.py程序:
#!/usr/bin/env python
"""
Example usage:
python label_images.py input.yaml [output_folder]
"""
import sys
import os
import cv2
from read_label_file import get_all_labels
from WriteFileXml import writeInfoToXml
def ir(some_value):
"""Int-round function for short array indexing """
return int(round(some_value))
def show_label_images(input_yaml, output_folder=None):
images = get_all_labels(input_yaml)
if output_folder is not None:
if not os.path.exists(output_folder):
os.makedirs(output_folder)
for i, image_dict in enumerate(images):
#print image_dict['boxes']