FCN语义分割——直接加载图像数据

最新推荐文章于 2023-01-01 17:05:42 发布

m_buddy

最新推荐文章于 2023-01-01 17:05:42 发布

阅读量2k

点赞数

分类专栏：机器学习文章标签： FCN 图像语义分割 Caffe

本文链接：https://blog.csdn.net/m_buddy/article/details/78618793

版权

机器学习专栏收录该内容

34 篇文章 3 订阅

订阅专栏

前言

在之前的一篇博客中我们使用了在Github上的代码进行语义分割，在进行训练的时候Github上给出的是mat文件类型的图像数据，这就很不方便了。这里经过查阅相关资料之后发现不需要进行格式的转换也可以进行训练的。

修改过程

这里还是用之前的博客里面提到的voc-fcn8s。打开train.prototxt和val.prototxt之后可以看到这样的层定义

layer {
  name: "data"
  type: "Python"
  top: "data"
  top: "label"
  python_param {
    module: "voc_layers"
    layer: "SBDDSegDataLayer"
    param_str: "{\'sbdd_dir\': \'../data/sbdd/dataset\', \'seed\': 1337, \'split\': \'train\', \'mean\': (104.00699, 116.66877, 122.67892)}"
  }
}

里面的module指明了使用的python文件，也就是用来进行数据导入的。打开它我们可以看到在类SBDDSegDataLayer的成员函数load_label使用到了mat文件，如下

def load_label(self, idx):
    """
    Load label image as 1 x height x width integer array of label indices.
    The leading singleton dimension is required by the loss.
    """
    import scipy.io
    mat = scipy.io.loadmat('{}/cls/{}.mat'.format(self.sbdd_dir, idx))
    label = mat['GTcls'][0]['Segmentation'][0].astype(np.uint8)
    label = label[np.newaxis, ...]
    return label

将其修改为

def load_label(self, idx):
    """
    Load label image as 1 x height x width integer array of label indices.
    The leading singleton dimension is required by the loss.
    """
    im = Image.open('{}/cls/{}.png'.format(self.sbdd_dir, idx))
    label = np.array(im, dtype=np.uint8)
    label = label[np.newaxis, ...]
    return label

就可以直接进行加载图像数据了。
ref: caffe下fcn数据集制作的简化

PS 之前应为没有注意好图像的通道问题导致了CUBLAS_STATUS_MAPING_ERROR的问题
eeor
这里是因为本人私自加了im= im.convert(‘L’)。导致参数不匹配，出现错误，将其删除之后正常运行。类似的出现这种错误的原因主要为输入参数范围不匹配等造成的。

m_buddy

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
FCN语义分割——直接加载图像数据

前言在之前的一篇博客中我们使用了在Github上的代码进行语义分割，在进行训练的时候Github上给出的是mat文件类型的图像数据，这就很不方便了。这里经过查阅相关资料之后发现不需要进行格式的转换也可以进行训练的。修改过程这里还是用之前的博客里面提到的voc-fcn8s。打开train.prototxt和val.prototxt之后可以看到这样的层定义layer { name: "data"
复制链接

扫一扫

专栏目录