图像语义分割-FCN

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
图像级的分类:假设数据集共有c类, 网络最终输出会是一个长为c的输出向量, 表示输入图像属于每一类的概率。

语义级别语义分割:得到对应位置每个像素的分类结果。其目的是将图像分割为若干个区域,语义相同的像素被分在同一区域内。

边缘检测:相当于一个二分类问题,判断每个像素是不是边缘。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
传统做法:以某个像素点为中心取一个图像块,作为样本输入网络,网络输出为中心像素点属于每一类的概率。在测试阶段, 在测试图片上以每个像素点为中心采一个图像块进行分类(sliding windows)。缺点:时间复杂度高;受到图像块限制,无法感知更大的上下文信息。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

FCN:
论文:https://arxiv.org/abs/1411.4038
程序:https://github.com/shelhamer/fcn.berkeleyvision.org
这里写图片描述
Input->conv1_1->con1_2->pool1->conv2_1->conv2_2->pool2->conv3_1->conv3_2->conv3_3->pool3->conv4_1->conv4_2->conv4_3->pool4
->conv5_1->conv5_2->conv5_3->pool5->fc6(+drop6)->fc7(+drop7)->score_fr->upscore->crop

(其中fc6和fc7的特征图数目为4096,score_fr的特征图数目为类别数。且每一个卷积层后面都接一个Relu层。upscore上采样层的参数为kernelsize=64,stride=32。)

训练时caffe中的loss为SoftmaxWithLoss,tensorflow中的
loss=tf.reduce_mean((tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits,labels=tf.squeeze(annotation, squeeze_dims=[3]),name=”entropy”))))
其中,logits的尺寸为IMAGE_SIZE*IMAGE_SIZE*num_classes,annotation的尺寸为IMAGE_SIZE*IMAGE_SIZE*1

http://blog.csdn.net/weixin_35653315/article/details/54602190(Semantic Segmentation with FCN里的32x, 16x和8x)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值