参考博文:
1、PointRend: Image Segmentation as Rendering(论文解读二十四)https://blog.csdn.net/qq_41997920/article/details/104536014
2、【CV论文笔记】PointRend: Image Segmentation as Rendering https://www.jianshu.com/p/52feafcfdc8f
3、FAIR(何恺明团队新作) PointRend:将图像分割视为渲染(Rendering) https://zhuanlan.zhihu.com/p/98181358
4、欠采样(undersampling)和过采样(oversampling)会对模型带来怎样的影响? https://www.zhihu.com/question/269698662
5、计算机中所说的「渲染」是什么意思?https://www.zhihu.com/question/31971846 后面有个解释挺有趣
6、挺好的一个知乎深度学习小团队 https://www.zhihu.com/people/hoshi-83-39/posts
1、摘要
2、整套PointRend模块包含3个部分
- 1)一种选择少量合适像素点的策略。这种策略能帮助模型尽可能少的去选择那些真正需要去进一步判断的点,从而避免计算量过大的问题。
- 2)对于每一个被选出来的点,如何对该点构建特征向量(point-wise feature representation)。
- 3)根据每一个点提取出的特征,去预测该点所属的类别。
2.1 Point Selection for Inference and Training
![](https://img-blog.csdnimg.cn/20200918110233656.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3d1bGluZzEyOQ==,size_16,color_FFFFFF,t_70)
用于推断的点选择策略受到计算机图形学中自适应细分(adaptive subdivision)这一经典技术的启发。该技术通过计算与其近邻的值显著不同的位置,来高效渲染高分辨率图像(如通过光线追踪);其他位置的值则通过内插已经计算好的输出值来获得(从粗糙网格开始)。
该“渲染”方法就是从常规的网络的最后一层输出开始(意思就是从网络的最深层,即感受野最大的那层开始上采样迭代),在每一次迭代的过程中,PointRend都会用双线性差值(bilinear interpolation)的办法进行上采样,并且从中选取N个不确定的点(比如那些在二分蒙版的情况下概率接近0.5的),生产该点的特征,并预测它们的标签。这一方法将被迭代使用,直到达到输出的分辨率大小。
![](https://img-blog.csdnimg.cn/20200918110323836.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3d1bGluZzEyOQ==,size_16,color_FFFFFF,t_70)
1)Over generation:从均匀分布中随机选取kN个候选点。
2)Importance sampling:通过插值计算出选中的kN个点,对该任务的不确定性估计,再从中选择个βN点。 (β ∈ [0,1])
3)Coverage:剩下的个点就从剩下的候选点均匀采样。
2.2 Point-wise Representation and Point Head
其实就是将两种不同的特征(细粒度特征和粗粒度特征)进行拼接,作为每一个点的特征表示。两者的作用分别是提供目标的细节信息以及全局的上下文信息。
最后就是Point Head,比较容易理解,就是给定每个点的特征表示,采用MLP(multi-layer perceptron)进行分割预测,预测点的类别标签。
1)coarse prediction可以是Mask R-CNN中 7×7 轻量级mask head的输出。
2)Features can be extracted from a single feature map (e.g., res 2 in a ResNet); they can also be extracted from multiple feature maps (e.g., res 2 to res 5 , or their feature pyramid [28] counterparts) and concatenated, following the Hypercolumn method [17].