PaperReading2-Pyramid Attention Network for Semantic Segmentation

今天我给大家介绍的是Face++2018发表的一篇关于图像分割的论文《Pyramid Attention Network
for Semantic Segmentation
》,这篇论文属于Attention系列,介绍了结合金字塔的Attention网络,论文中多次讲到了本方法和现有一些分割方法的不同,确实存在创新,可以在下面的介绍详细看。

总的来说,论文是将Attention机制与金字塔结构结合作为本文的亮点,这样可以在高层语义指导的基础上来提取相对与较低层的精确的密集特征,取代了其他方法里面的复杂的空洞卷积dilated和多个编码解码器的操作,跳出了以往常常用到的U-Net结构;再者,另一个亮点与Global  average pooling类似的操作,采用了一个全局pooling进行底层特征的权值加权,对特征的map起到的选取的作用。在上面两步的结合下论文展示的结果是在PASCAL VOC 2012和Cityscapes基准测试中实现了最先进的性能,没有COCO预训练的情况下,PASCAL VOC 2012的mIoU精度为84.0%,而没有COCO数据集的培训。

论文的结构主要如下:

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值