FCN语义分割——直接加载图像数据

前言

在之前的一篇博客中我们使用了在Github上的代码进行语义分割,在进行训练的时候Github上给出的是mat文件类型的图像数据,这就很不方便了。这里经过查阅相关资料之后发现不需要进行格式的转换也可以进行训练的。

修改过程

这里还是用之前的博客里面提到的voc-fcn8s。打开train.prototxt和val.prototxt之后可以看到这样的层定义

layer {
  name: "data"
  type: "Python"
  top: "data"
  top: "label"
  python_param {
    module: "voc_layers"
    layer: "SBDDSegDataLayer"
    param_str: "{\'sbdd_dir\': \'../data/sbdd/dataset\', \'seed\': 1337, \'split\': \'train\', \'mean\': (104.00699, 116.66877, 122.67892)}"
  }
}

里面的module指明了使用的python文件,也就是用来进行数据导入的。打开它我们可以看到在类SBDDSegDataLayer的成员函数load_label使用到了mat文件,如下

def load_label(self, idx):
    """
    Load label image as 1 x height x width integer array of label indices.
    The leading singleton dimension is required by the loss.
    """
    import scipy.io
    mat = scipy.io.loadmat('{}/cls/{}.mat'.format(self.sbdd_dir, idx))
    label = mat['GTcls'][0]['Segmentation'][0].astype(np.uint8)
    label = label[np.newaxis, ...]
    return label

将其修改为

def load_label(self, idx):
    """
    Load label image as 1 x height x width integer array of label indices.
    The leading singleton dimension is required by the loss.
    """
    im = Image.open('{}/cls/{}.png'.format(self.sbdd_dir, idx))
    label = np.array(im, dtype=np.uint8)
    label = label[np.newaxis, ...]
    return label

就可以直接进行加载图像数据了。
ref: caffe下fcn数据集制作的简化

PS 之前应为没有注意好图像的通道问题导致了CUBLAS_STATUS_MAPING_ERROR的问题
eeor
这里是因为本人私自加了im= im.convert(‘L’)。导致参数不匹配,出现错误,将其删除之后正常运行。类似的出现这种错误的原因主要为输入参数范围不匹配等造成的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值