在进行目标检测或语义分割模型的训练时,我们往往会融合开源数据,但数据集较多就会存在标签不一致的问题,下面的代码可用于修改txt格式标签文件中的label字段:
import os
def changeLabel(txt_path, new_txt_path):
"""
:param txt_path: 原始的标签文件路径
:param new_txt_path: 保存修改后的标签文件的路径
"""
filenames = os.listdir(txt_path)
for filename in filenames:
if '.txt' in filename: # 根据类型判断是否为标签文件
with open(txt_path + filename, 'r', encoding='gbk') as f:
file_data = ''
for line in f.readlines():
# 替换label字段
line = line.replace('storage_tank', 'storage-tank') #将需要修改的字段进行替换replace('错误的字段',‘正确的字段’)
file_data += line
with open(new_txt_path + filename, 'w', encoding="gbk") as fw:
print('filename: ', filename)
print('file_data: ', file_data)
fw.write(file_data)
label_path = './test/labels/' # 原始标签文件夹
dst_path = './test/dst_la

本文档介绍了如何使用Python脚本批量修改txt、json和xml格式的标签文件,解决目标检测和语义分割模型训练中数据集标签不一致问题,包括storage-tank到storage-tank的替换,json中label名的统一,以及xml中类别名称的更改。
最低0.47元/天 解锁文章
2155

被折叠的 条评论
为什么被折叠?



