5ham1ess-CSDN博客

原创 farseenet（实时语义分割网络）

arxiv地址farseenet是商汤科技和东京大学最近放出的论文，用于实时语义分割网络，提出了一个新的模块（CF-ASPP）和新的训练方法。motivation论文肯定了空间金字塔结构结构对网络性能的提升，并且运用到了CF-ASPP模块。目前的语义分割算法，都是先利用特定的backbone（如resnet101，resnet50）提取特征，再做进一步处理。这些特征输出的特征图的通道数会很多，加大了计算量，无法达到实时分割。文章降低了金字塔池化层中的通道数，以减小计算量。如何获取高分辨率的mask

2020-05-25 17:29:11 519

原创 PointRend：Image Segmentation as Rendering

arxiv地址论文为2020年CVPR，作者包括何凯明大神。论文的主要思想是将图像分割问题看成计算机图形学中的渲染问题。首先说一下渲染（render）的意思渲染(render)渲染来源于计算机图形学，指的是将模型转化为数字图像进行显示的过程，广泛应用于特效和游戏制作。GPU（graph processing unit）简单翻译是图形处理单元，这里的graph指的就是计算机图形。在特效和游戏制作中，会构建出各种2D或者3D模型；进行显示的时候，就可以把显示器看作一个视窗，上面每一个像素映射到这些模型上

2020-05-13 23:48:25 420

原创 Deformable Convolution Network （可变形卷积）

Deformable Convolution Network （可变形卷积）摘要简介可变形卷积原理可变形RoI池化和PSRoI池化论文arxiv地址笔者只将自己对于论文的理解和细节方面分享，不是论文翻译，以供交流学习，欢迎大家留言讨论。摘要CNN网络在训练完成之后，模型固定，对于有特殊几何形变的目标的感应能力不高。简单理解就是如果训练集中只出现直立站着的人，那么训练出的网络在预测的时候，能特定的感应出站着的人，而不能灵敏的感应到躺着或者趴着的人。可以简单理解是存在一种泛化性问题。对此提出可变形卷积和

2020-05-08 22:42:29 623

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人