在训练神经网络的过程中,遇见了一个棘手的问题,搭建的模型需要用到png格式的标签,但是公开数据集CrackForest标签只有mat和seg两种格式,所以编写下面代码用于将seg标签转为二值化的mask掩码。
原始标签格式如下:
经转换后,mask掩码如下:
from PIL import Image
import os
def parse_seg_to_image(seg_file_path, output_image_path):
# 初始化图像
with open(seg_file_path, 'r') as file:
lines = file.readlines()
# 获取宽度和高度
width = int(lines[1].split()[1])
height = int(lines[2].split()[1])
image = Image.new("1", (width, height), 0) # 创建一个全黑的单色图像
# 跳过非数据行
data_lines_start = lines.index('data\n') + 1
# 遍历数据行
for line in lines[data_lines_start:]:
parts = line.strip().split()
if len(parts) == 4:
seg_num, row_index, column1, column2 = map(int, parts)
# 在指定的行和列范围内设置像素值
for col in range(column1, column2 + 1):
image.putpixel((col, row_index), seg_num)
# 保存图像
image.save(output_image_path)
# 指定seg文件和输出png文件所在的目录
seg_dir = r'自己的seg文件夹所在地址'
png_dir = r'转换后的标签文件所在地址'
# 创建输出目录,如果不存在的话
if not os.path.exists(png_dir):
os.makedirs(png_dir)
# 遍历seg文件夹中的所有文件
for filename in os.listdir(seg_dir):
if filename.endswith('.seg'):
seg_file_path = os.path.join(seg_dir, filename)
png_file_path = os.path.join(png_dir, os.path.splitext(filename)[0] + '.png')
parse_seg_to_image(seg_file_path, png_file_path)