- 博客(3)
- 收藏
- 关注
原创 farseenet(实时语义分割网络)
arxiv地址farseenet是商汤科技和东京大学最近放出的论文,用于实时语义分割网络,提出了一个新的模块(CF-ASPP)和新的训练方法。motivation论文肯定了空间金字塔结构结构对网络性能的提升,并且运用到了CF-ASPP模块。目前的语义分割算法,都是先利用特定的backbone(如resnet101,resnet50)提取特征,再做进一步处理。这些特征输出的特征图的通道数会很多,加大了计算量,无法达到实时分割。文章降低了金字塔池化层中的通道数,以减小计算量。如何获取高分辨率的mask
2020-05-25 17:29:11 519
原创 PointRend:Image Segmentation as Rendering
arxiv地址论文为2020年CVPR,作者包括何凯明大神。论文的主要思想是将图像分割问题看成计算机图形学中的渲染问题。首先说一下渲染(render)的意思渲染(render)渲染来源于计算机图形学,指的是将模型转化为数字图像进行显示的过程,广泛应用于特效和游戏制作。GPU(graph processing unit)简单翻译是图形处理单元,这里的graph指的就是计算机图形。在特效和游戏制作中,会构建出各种2D或者3D模型;进行显示的时候,就可以把显示器看作一个视窗,上面每一个像素映射到这些模型上
2020-05-13 23:48:25 420
原创 Deformable Convolution Network (可变形卷积)
Deformable Convolution Network (可变形卷积)摘要简介可变形卷积原理可变形RoI池化和PSRoI池化论文arxiv地址笔者只将自己对于论文的理解和细节方面分享,不是论文翻译,以供交流学习,欢迎大家留言讨论。摘要CNN网络在训练完成之后,模型固定,对于有特殊几何形变的目标的感应能力不高。简单理解就是如果训练集中只出现直立站着的人,那么训练出的网络在预测的时候,能特定的感应出站着的人,而不能灵敏的感应到躺着或者趴着的人。可以简单理解是存在一种泛化性问题。对此提出可变形卷积和
2020-05-08 22:42:29 623
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人