unet对voc2012数据集分割

数据的读取

torch.utils.data.Dataset
对Dataset的具体介绍
Dataset是一个抽象类,相比于自己写的迭代器,它可以方便地实现多线程读取,shuffle,batch操作
自定义一个类继承它,需要自己实现__getitem__ () len__(),写完之后,就可以对整个数据进行索引等操作

接下来就是用dataloader,进行batch_size的设置和shuffle操作

transform

对输入图片和标签进行预处理设置,做分割主要是把label先变为灰度图,然后再把每个像素进行one-hot编码

one-hot

先看看onehot长啥样
tensor([[0., 1., 0., 0.],
[0., 0., 1., 0.],
[1., 0., 0., 0.],
[0., 0., 0., 1.]])

制作流程

class onehot(object):
    def __init__(self):
        self.n_classes = 21

    def __call__(self, image_tensor):
        h, w = image_tensor.size() 
        onehot = torch.LongTensor(self.n_classes, h, w).zero_() 生成一个相同形状的全0 tensor
        # print(onehot)
        image_tensor = image_tensor.unsqueeze_(0)
        onehot = onehot.scatter_(0, image_tensor, 1) 0指定纬度 用1填充
        return onehot

u-net的代码实现

先进行下采样,再上采样

在这里插入图片描述
最后输出的格式为 batch_sizex224x224x21(假如图片大小为224x224,算上背景为21分类)

loss

loss的输入为 预测值:batch_sizex224x224x21(未做softmax,未做one-hot),label batch_sizex224x224x21(已做onehot), loss 做的工作是把预测值做softmax再做one-hot,再和label做交叉熵得出损失,最后在进行反向传播,更新权重。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值