轻量级网络--MobileNet论文解读_DFan的NoteBook-CSDN博客_mobilenet论文
轻量级模型:MobileNet V2_小麦草的博客-CSDN博客_mobilenetv2
目标检测
目标检测网络CenterNet详解(四) - silence_cho - 博客园
分割
综述
FCN UNet
缺点:
在这里我们要注意的是FCN的缺点:
- 是得到的结果还是不够精细。进行8倍上采样虽然比32倍的效果好了很多,但是上采样的结果还是比较模糊和平滑,对图像中的细节不敏感。
- 是对各个像素进行分类,没有充分考虑像素与像素之间的关系。忽略了在通常的基于像素分类的分割方法中使用的空间规整(spatial regularization)步骤,缺乏空间一致性。
ParseNet
【图像分割模型】全局特征与局部特征的交响曲—ParseNet - 知乎
OCRNet
【语义分割】——读源码、论文理解OCRNet_农夫山泉2号的博客-CSDN博客_ocrnet
segnet
SegNet的优点包括:1)改善边界轮廓;2)参数数量减少,优化了算法空间复杂度;3)能够端到端地训练;4)这种上采样形式只需稍微修改一下就能被任意encoder-decoder架构的网络采用;
PSPNet
Pyramid Scene Parsing Network - 知乎
What:PsPNet主要是通过金字塔池化提取多尺度信息。按论文的描述:更好的提取全局上下文信息,同时利用局部和全局信息,使得场景识别更加可靠。(从技术的角度来说,我觉得就是从不同的视野去寻找特征,类似放大镜放大,放大倍数大,视野小,物体清楚,但是看不清物体之间的关系;放大倍数小,视野大,物体模糊,但是可以看清楚物体之间的关系。)除此之外,文章还通过Ablation study (类似控制变量法,移除一个结构,研究这个结构的影响)研究金字塔多尺度池化,池化的方式,辅助损失函数,预训练模型的作用。
Why:PsPNet提出的原因,可以总结为一句话:获取全局环境信息,利用全局信息和局部信息获得更加可靠地结果。怎么做到的?提取多尺度信息。为什么提取多尺度信息可以获取全局环境信息?经验总结。
RefineNet
DeepLab V1
- 要解决什么问题?
- 使用CNN解决图像分割问题是,主要存在两个问题:
- 下采样(downsampling,如max pooling)导致的细节信息丢失。
- CNN的空间不变性(spatial insensitivity/invariance)。
- 用了什么方法解决?
- 使用带孔卷积解决下采样问题。
- 使用Dense CRF解决空间不变形问题。
- 效果如何?
- 在VOC2012上获得了当时的最优性能,在测试集上达到71.6%的IOU。
- 同时,运行效率达到8 frames per second。
- 还存在什么问题?
- 基于VGG提取特征,有些落后(从现在的角度看)。
- 从目前来看,效果一般。