# 记录自己转png的过程,主要参考https://www.jianshu.com/p/29604b12f776
1:使用labelme标注工具
直接在命令行安装或者在anaconda下面新建虚拟环境安装(避免污染环境,不用的时候可以直接delete该环境)
直接命令行(base)安装
pip install labelme
labelme
标注的数据集放到了F盘的文件夹 的 json中
2:使用提供的脚本json_to_dataset.py把json转换为png形式,对于多分类的数据标注,需要在下面路径找到json_to_dataset.py修改:
首先修改原有的json_to_dataset.py文件。
import argparse
import base64
import json
import os
import os.path as osp
import imgviz
import PIL.Image
import yaml
from labelme.logger import logger
from labelme import utils
'''multiple json files'''
def main():
parser = argparse.ArgumentParser()
parser.add_argument('json_file') # 标注文件json所在的文件夹
parser.add_argument('-o', '--out', default=None)
args = parser.parse_args()
json_file = args.json_file
list = os.listdir(json_file) # 获取json文件列表
for i in range(0, len(list)):
path = os.path.join(json_file, list[i]) # 获取每个json文件的绝对路径
filename = list[i][:-5] # 提取出.json前的字符作为文件名,以便后续保存Label图片的时候使用
extension = list[i][-4:]
if extension == 'json':
if os.path.isfile(path): # 判断是否是文件
data = json.load(open(path)) # 加载json文件
img = utils.image.img_b64_to_arr(data['imageData']) # 根据'imageData'字段的字符得到原图像
# data['shapes']是json文件中记录着标注的位置及label等信息的字段
# label_name_to_value = {"_background_": 0} # change # 原来的设置
label_name_to_value = {'_background_': 0,
'A': 1,
'B': 2,
'C': 3,
'D': 4} # 新的类别设置 , 这里根据自己的需要,把A,B,C,D换成自己标注的类别
for shape in sorted(data["shapes"], key=lambda x: x["label"]):
label_name = shape["label"]
if label_name in label_name_to_value:
label_value = label_name_to_value[label_name]
else:
label_value = len(label_name_to_value)
label_name_to_value[label_name] = label_value
# lbl为label图片(标注的地方用类别名对应的数字来标,其他为0)
lbl, _ = utils.shapes_to_label(
img.shape, data["shapes"], label_name_to_value
)
# lbl_names为label名和数字的对应关系字典
label_names = [None] * (max(label_name_to_value.values()) + 1)
for name, value in label_name_to_value.items():
label_names[value] = name
lbl_viz = imgviz.label2rgb(
label=lbl, image=imgviz.asgray(img), label_names=label_names, loc="rb"
)
# label=lbl, image=imgviz.asgray(img), label_names=label_names, loc="rb"
# )
out_dir = osp.basename(list[i])[:-5]+'_json' # 创建“*_json”文件夹
# os.path.dirname()返回去掉文件名的路径
out_dir = osp.join(osp.dirname(list[i]), out_dir)
if not osp.exists(out_dir):
os.mkdir(out_dir)
PIL.Image.fromarray(img).save(osp.join(out_dir, '{}_source.png'.format(filename)))
utils.lblsave(osp.join(out_dir, "{}_label.png".format(filename)), lbl)
PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, '{}_mask.png'.format(filename)))
#PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, '{}_viz.jpg'.format(filename)))
with open(osp.join(out_dir, 'label_names.txt'), 'w') as f:
for lbl_name in label_names:
f.write(lbl_name + '\n')
# warnings.warn('info.yaml is being replaced by label_names.txt')
# info = dict(label_names=lbl_names)
# with open(osp.join(out_dir, 'info.yaml'), 'w') as f:
# yaml.safe_dump(info, f, default_flow_style=False)
print('Saved to: %s' % out_dir)
if __name__ == "__main__":
main()
我的这个py文件在D:\anaconda3\Lib\site-packages\labelme\cli 路径下面
然后运行如下的
其中 cd png的作用是运行程序后,生成的png文件所属的文件夹,F: /json对应的是json文件所属的文件夹。
3:把数据整理为images,segmentations对应的文件夹
# -*- coding: utf-8 -*-
import os
import numpy as np
import json
import shutil
def find_dir_path(path, keyword_name, dir_list):
files = os.listdir(path)
for file_name in files:
file_path = os.path.join(path, file_name)
if os.path.isdir(file_path) and keyword_name not in file_path:
find_dir_path(file_path, keyword_name, dir_list)
elif os.path.isdir(file_path) and keyword_name in file_path:
dir_list.append(file_path)
all_result_path = []
src_path = r'/png_2' # 这个地方写你的绝对地址,就是前面由json文件生成的文件夹的地址
label_save_path = r'png_2/segmentations' # 类比上面修改为自己地址
image_save_path = r'png_2/images' # 类比上面修改为自己地址
find_dir_path(src_path, '_json', all_result_path) # 找出所有带着关键词(_json)的所有目标文件夹
#print(all_result_path)
for dir_path in all_result_path:
# print(dir_path)
file_name = dir_path.split('/')[-1]
key_word = file_name[:-5]
label_file = dir_path + "/" + key_word + "_label.png"
new_label_save_path = label_save_path + "/" + key_word + "_label.png" # 复制生成的label.png到新的文件夹segmentations
shutil.copyfile(label_file, new_label_save_path)
# img_dir = os.path.dirname(dir_path) # 复制原图到新的文件夹images
img_dir = dir_path # change
img_file = img_dir + "/" + key_word + "_source.png"
# print(img_file)
new_img_save_path = image_save_path + "/" + key_word + "_source.png"
shutil.copyfile(img_file, new_img_save_path)
然后运行上述py文件就可以得到对应的images文件夹和segmentations的文件夹啦!