计算机视觉——语义分割
- 语义分割是什么?
- 语义分割评价
- 语义分割数据集
- 经典算法介绍
-
- FCN
- Pyramid Scene Parsing Network
- Deeplab V1 V2 V3 V3plus
- UperNet
- Squeeze-and-Excitation Networks
- Selective Kernel Networks
- Gather-Excite: Exploiting Feature Context in Convolutional Neural Networks
- CBAM
- ENCnet
- PSANet
- Attention is All you Need
- Non-local Neural Networks
- Asymmetric Non-Local Neural Networks
- DANET
- GCNet
- CCNet
- DNLnet
- SFNet
- AlignSeg
- OCRnet
- HIERARCHICAL MULTI-SCALE ATTENTION
语义分割是什么?
语义分割是典型的CV问题,输入为原始数据(如平面图像),输出为具有突出显示的感兴趣区域的掩膜。过程是通过查找每一个像素并根据其所属感兴趣的对象分配相应ID。
语义分割评价
- IOU=TP/(FP+FN+TP) 即交并比
- mIOU=mean(IOU) 即均交并比,在每个类上度量再求平均
- PA=TP/ALL 即像素精度
- mPA=mean(PA) 即均像素精度,是PA的简单提升,计算每个类内的正确分类像素比例再求平均。
语义分割相关概念可见论文:Zhou, Bolei, Zhao, Hang, Puig, Xavier,etal. Semantic Understanding of Scenes through the ADE20K Dataset[J]. International Journal of Computer Vision, 2016, 127(3):302-321.
语义分割数据集
- CityScapes 城市车道
- ADE20K 通用
- MSCOCO 通用
- CityScapes 3D 城市车道
- Pascal VOC 通用
- Mapillary Vistas 城市街道
经典算法介绍
以下是我整理的在理解各个算法时看到比较好的博客讲解(仅供参考),大部分博客中有论文原地址。
FCN
相关论文:Long J , Shelhamer E , Darrell T . Fully Convolutional Networks for Semantic Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 39(4):640-651.
博客讲解:FCN的理解
Pyramid Scene Parsing Network
相关论文:Zhao H , Shi J , Qi X , et al. Pyramid Scene Parsing Network[J]. 2016.
博客讲解:论文笔记:《Pyramid Scene Parsing Network》
Deeplab V1 V2 V3 V3plus
相关论文:Chen L C , Papandreou G , Kokkinos I , et al. DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20