用python实现将json文件转化为xml格式

最新推荐文章于 2024-06-24 10:11:07 发布

Tomorrow；

最新推荐文章于 2024-06-24 10:11:07 发布

阅读量2.6k

点赞数 2

分类专栏：学习笔记文章标签： python json xml

本文链接：https://blog.csdn.net/qq_42548340/article/details/121763669

版权

学习笔记专栏收录该内容

32 篇文章 5 订阅

订阅专栏

首先此json格式的标注来自于阿里天池竞赛街景字符编码识别
其次json转xml的脚本不能万能的，因为每个json文件的内部会略有不同
此例的json内部格式如下

转化后的xml格式如下（就拿第一个标注举例）

4.脚本文件如下

from xml.dom.minidom import parseString
import xml.dom.minidom
import os
import cv2
import json

_IMAGE_PATH = 'E:/coco/COCO/train'
_INDENT = '' * 4
_NEW_LINE = '\n'
_FOLDER_NODE = 'yaoganDataSet'
_ROOT_NODE = 'annotation'
_DATABASE_NAME = ''
_ANNOTATION = 'COCO2014'
_AUTHOR = 'li'
_SEGMENTED = '0'
_DIFFICULT = '0'
_TRUNCATED = '0'
_POSE = 'Unspecified'
_ANNOTATION_SAVE_PATH = 'Q:/tianchi_competition/Street_Recognization/Annotations'

# 封装创建节点的过程
def createElementNode(doc, tag, attr):  # 创建一个元素节点
    element_node = doc.createElement(tag)
    # 创建一个文本节点
    text_node = doc.createTextNode(attr)
    # 将文本节点作为元素节点的子节点
    element_node.appendChild(text_node)
    return element_node

def createChildNode(doc, tag, attr, parent_node):
    child_node = createElementNode(doc, tag, attr)
    parent_node.appendChild(child_node)

if __name__ == "__main__":
    json_path = "Q:/tianchi_competition/Street_Recognization/1/"
    img_path = "Q:/tianchi_competition/Street_Recognization/JPEGImages/"
    json_path1=os.path.join(json_path+'mchar_train.json')
    with open(json_path1, "r") as f:
        ann = json.load(f)
        for per_img_info in ann.items():
            per_img_name=per_img_info[0]
            saveName = per_img_name.strip(".png")
            saveName2=saveName+'.jpg'
            xml_file_name = os.path.join(_ANNOTATION_SAVE_PATH, (saveName + '.xml'))
            img = cv2.imread(os.path.join(img_path, saveName2))
            print(os.path.join(img_path, saveName2))
            # cv2.imshow(img)
            height, width, channel = img.shape
            print(height, width, channel)

            """创建xml框架"""
            my_dom = xml.dom.getDOMImplementation()
            doc = my_dom.createDocument(None, _ROOT_NODE, None)
            # 获得根节点
            root_node = doc.documentElement
            # folder节点
            createChildNode(doc, 'folder', _FOLDER_NODE, root_node)
            # filename节点
            createChildNode(doc, 'filename', saveName + '.png', root_node)
            print("正在创建各个结点中")
            # source节点
            source_node = doc.createElement('source')
            # source的子节点
            createChildNode(doc, 'database', _DATABASE_NAME, source_node)
            createChildNode(doc, 'annotation', _ANNOTATION, source_node)
            createChildNode(doc, 'image', 'flickr', source_node)
            root_node.appendChild(source_node)
            size_node = doc.createElement('size')
            createChildNode(doc, 'width', str(width), size_node)
            createChildNode(doc, 'height', str(height), size_node)
            createChildNode(doc, 'depth', str(channel), size_node)
            root_node.appendChild(size_node)
            # 创建segmented节点
            createChildNode(doc, 'segmented', _SEGMENTED, root_node)

            per_img_loc=per_img_info[1]
            num_label=per_img_loc['label']
            l=len(num_label)
            for i in range(l):
                xmin= per_img_loc['left']
                ymin= per_img_loc ['top']
                xmax=[]
                ymax=[]
                for m,n in zip(xmin,per_img_loc ['width']):
                    per_xmax=m+n
                    xmax.append(per_xmax)
                for p,q in zip(ymin,per_img_loc ['height']):
                    per_ymax=p+q
                    ymax.append(per_ymax )
                label=per_img_loc['label']

                # object节点
                object_node = doc.createElement('object')
                # object的子节点
                createChildNode(doc, 'name', str(label[i]), object_node)
                createChildNode(doc, 'pose', 'undefine', object_node)
                createChildNode(doc, 'truncated', 'undefine', object_node)
                createChildNode(doc, 'difficute', str(0), object_node)
                #创建object子节点bndbox的子节点
                bndbox_node = doc.createElement('bndbox')
                createChildNode(doc, 'xmin', str(xmin[i]), bndbox_node)
                createChildNode(doc, 'ymin', str(ymin[i]), bndbox_node)
                createChildNode(doc, 'xmax', str(xmax[i]), bndbox_node)
                createChildNode(doc, 'ymax', str(ymax[i]), bndbox_node)
                object_node.appendChild(bndbox_node)
                root_node.appendChild(object_node)
                i = i + 1

            with open('tmp.xml', 'w', encoding='utf-8') as f:
                    doc .writexml(f, indent='\t', addindent='\t', newl='\n', encoding="utf-8")
            f.close()
            fin = open('tmp.xml')
            fout = open(xml_file_name, 'w')
            lines = fin.readlines()
            for line in lines[1:]:
                if line.split():
                    fout.writelines(line)
            fin.close()
            fout.close()

踩过的坑：

cv2.imred() 只能读取.jpg格式的图片，其次括号中的路径不能有中文

Tomorrow；

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
用python实现将json文件转化为xml格式

首先此json格式的标注来自于阿里天池竞赛街景字符编码识别其次json转xml的脚本不能万能的，因为每个json文件的内部会略有不同此例的json内部格式如下转化后的xml格式如下（就拿000000.png举例）4.脚本文件如下from xml.dom.minidom import parseStringimport xml.dom.minidomimport osimport cv2import json_IMAGE_PATH = 'E:/coco/COCO/train'.
复制链接

扫一扫