Unet语义分割

初学语义分割,由于Unet是2015年发布,距今已有八年,以现在的视角看,难免存在许多缺陷。


一、学习网络结构

原论文Unet网络结构图:

 可注意到:

1、该结构输入与输出大小不同。

2、没有使用BN层,其中conv3x3的卷积层使用的是步长s=1,padding=0,每一次卷积都会减小大小为2的高度和宽度。

现在很多使用VGG16来代替这个主干特征提取网络,加强特征提取网络部分结构基本不变,仅仅是把copy and crop(裁剪和拼接)部分改为contact(拼接)。

其与原Unet类似,相比之下没有了部分缺点,3x3的卷积采用了步长为1,padding=1,如此一来便不会改变输入输出的大小,且在加强特征提取网络阶段不需要裁剪可直接与相同空间维度的特征层进行拼接操作,不至于丢失部分信息。


二、训练:


使用的数据集是VOC2007的数据集(20类),仅使用部分(六百多张图片)数据集进行训练,预训练权重使用unet_vgg_voc.pth。训练轮数100轮(由于是使用colab服务器训练,训练了1.5小时中断,最终训练轮数为90epoch),以下是训练结果:

最好的一轮的训练结果:

分析:训练损失train loss总体趋于下降趋势,最低至0.038,但是验证损失val loss确是逐渐升高,最高可至0.334。

原因分析:可能是网络有一定深度,且数据集较少,导致发生了过拟合现象。

解决方法:为了防止发生过拟合,使用Resnet残差网络能有效解决此类问题。


三、预测:

使用训练结果最好的一轮权重进行预测。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值