搞了大半天labelme 的批量转换,一度气得想摔鼠标。那些奇奇怪怪的错误也不知道怎么回事,跑遍了CSDN也没找到怎么解决那些鬼东西。不过最终还是被我挖出了能用的批量转换代码(没办法,python小白只能票大佬的东西)!
参考博客指路
1.初次使用labelme遇到的坑labelme_json_to_dataset 文件json只生成4个文件缺少生成infoyaml文件
2.labelme 批量转换
3.如何用labelme标注语义分割数据集
4.labelme生成的json文件批量转换方法
labelme批量转换json文件方法
这个方法不需要降labelme的版本,我的labelme版本是4.5.7,亲测有效。
放个转换成功的截图嘻嘻嘻。
进入正题
首先,找到你的 json_to_dataset.py 文件。一般是在这个路径:
\anaconda\envs\labelme\Lib\site-packages\labelme\cli (自己安在哪个盘就到哪个盘去找)
然后用记事本打开,用下方代码全部替换:
import argparse
import base64
import json
import os
import os.path as osp
import imgviz
import PIL.Image
import yaml
from labelme.logger import logger
from labelme import utils
def main():
logger.warning(
"This script is aimed to demonstrate how to convert the "
"JSON file to a single image dataset."
)
logger.warning(
"It won't handle multiple JSON files to generate a "
"real-use dataset."
)
parser = argparse.ArgumentParser()
parser.add_argument("json_file")
parser.add_argument("-o", "--out", default=None)
args = parser.parse_args()
json_file = args.json_file
if args.out is None:
out_dir = osp.basename(json_file).replace(".", "_")
out_dir = osp.join(osp.dirname(json_file), out_dir)
else:
out_dir = args.out
if not osp.exists(out_dir):
os.mkdir(out_dir)
data = json.load(open(json_file))
imageData = data.get("imageData")
if not imageData:
imagePath = os.path.join(os.path.dirname(json_file), data["imagePath"])
with open(imagePath, "rb") as f:
imageData = f.read()
imageData = base64.b64encode(imageData).decode("utf-8")
img = utils.img_b64_to_arr(imageData)
label_name_to_value = {"_background_": 0}
for shape in sorted(data["shapes"], key=lambda x: x["label"]):
label_name = shape["label"]
if label_name in label_name_to_value:
label_value = label_name_to_value[label_name]
else:
label_value = len(label_name_to_value)
label_name_to_value[label_name] = label_value
lbl, _ = utils.shapes_to_label(
img.shape, data["shapes"], label_name_to_value
)
label_names = [None] * (max(label_name_to_value.values()) + 1)
for name, value in label_name_to_value.items():
label_names[value] = name
lbl_viz = imgviz.label2rgb(
label=lbl, img=imgviz.asgray(img), label_names=label_names, loc="rb"
)
PIL.Image.fromarray(img).save(osp.join(out_dir, "img.png"))
utils.lblsave(osp.join(out_dir, "label.png"), lbl)
PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, "label_viz.png"))
with open(osp.join(out_dir, "label_names.txt"), "w") as f:
for lbl_name in label_names:
f.write(lbl_name + "\n")
logger.warning('info.yaml is being replaced by label_names.txt')
info = dict(label_names=label_names)
with open(osp.join(out_dir, 'info.yaml'), 'w') as f:
yaml.safe_dump(info, f, default_flow_style=False)
logger.info("Saved to: {}".format(out_dir))
if __name__ == "__main__":
main()
然后保存就可以了。
修改json_to_dataset.py 文件,第一是为了生成info文件,4版本没有生成info文件的代码,所以要改。不过你要是不用info文件就不用改了。第二就是改完之后,可以直接打开Anaconda Prompt进行操作,但是我用这个方法只能转换前140个文件,从第141个开始就疯狂报错。
直接转换的步骤如下:
启动Anaconda Prompt,激活labelme环境(activate labelme),cd到你要放转换后的json文件夹的地方,然后输入:
labelme_json_to_dataset.exe E:\total\train_image\json
exe后面是你要转换的 .json 文件所在路径。
如果以上方法行不通,那么建议你改完 json_to_dataset.py 文件直接看第二步。
第二,修改完json_to_dataset.py 文件后,新建一个记事本文档,复制以下代码:
@echo off
for %%i in (*.json) do labelme_json_to_dataset "%%i"
pause
然后保存为后缀是“ .bat ”的文件,放在有要转换的 .json 文件的路径中。
第三,启动Anaconda Prompt,激活labelme环境(activate labelme),cd到你要放转换后的json文件夹的地方,输入 start test.bat
出现如下页面时,说明正在转换了!操作成功!