边缘检测BSDS500数据集处理

最新推荐文章于 2025-01-27 13:16:23 发布

weixin_46430272

最新推荐文章于 2025-01-27 13:16:23 发布

阅读量4.7k

点赞数 10

分类专栏：边缘检测

本文链接：https://blog.csdn.net/weixin_46430272/article/details/117754616

版权

边缘检测专栏收录该内容

1 篇文章

订阅专栏

本文介绍如何处理BSDS500数据集用于网络训练，包括将.mat格式的标签转换为.jpg格式，并实现不同标注者的图像叠加。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

边缘检测BSDS500数据集处理

数据集链接: 官网链接.
BSDS500就不过多介绍了，这里记录一下我在处理这个数据集用于网络训练的过程。
数据集下载下来以后label是以.m格式保存的，需要处理成.jpg或.png格式。
直接上代码：

from scipy import io
import scipy
import imageio
import os

#读取mat文件中所有数据
#mat文件里面是以字典形式存储的数据
#包括 dict_keys(['__globals__', 'groundTruth', '__header__', '__version__'])
#我们要用到'groundTruth']中的轮廓
#x['groundTruth'][0][0][0][0][1]为轮廓
#x['groundTruth'][0][0][0][0][0]为分割图


def bsds_trans(root, num_anno):
    PATH = os.path.join(root, 'data\\groundTruth')
    for sub_dir_name in ['train','test','val']:
        sub_pth = os.path.join(PATH,sub_dir_name)
        ##为生成的图片新建个文件夹保存
        save_pth = os.path.join(root,'data\\GT_convert_{}'.format(num_anno),sub_dir_name)
        os.makedirs(save_pth,exist_ok=True)

        print('开始转换'+sub_dir_name+'文件夹中内容')
        for index in range(len(os.listdir(sub_pth))):
            filename = os.listdir(sub_pth)[index]
            data = io.loadmat(os.path.join(sub_pth,filename))
            try:
                if len(data['groundTruth'][0]) < num_anno+1: raise IndexError
                edge_data = data['groundTruth'][0][num_anno][0][0][1]
                edge_data_255 = edge_data * 255
                new_img_name = filename.split('.')[0]+'.jpg'
                print(new_img_name)
                imageio.imsave(os.path.join(save_pth,new_img_name), edge_data_255)
                
            except IndexError:
                index = min(len(os.listdir(sub_pth))-1, index+1)
                filename = os.listdir(sub_pth)[index]


if __name__ == '__main__':
    #运行时需要改变root值为BSD500所在的相应根目录
    root = 'D:\\桌面\\bsds500\\BSR\\BSDS500'
    #选取不同标注者标注的label,范围（0，5）
    num_anno = 5
    bsds_trans(root, num_anno)