- 博客(6)
- 资源 (16)
- 收藏
- 关注
原创 《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》论文笔记
参考代码:无1. 概述导读:在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能,但是只通过top-down的FPN网络是很难去重建由于特征图的漂移(水平或是垂直方向运动)在经过pooling操作(pooling不具有平移不变性)带来结果相差很大的问题(特别针对小目标),而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释(卷积的平移不变形),进而会导致一些小目标定位性能降低。对此可以通过添加一个bottom-up的结构实现对特征图pooling经过操作之后带来的问题补偿,但是却需要消耗很多
2021-03-29 22:36:06 460
原创 《SiamFC++:Towards Robust and Accurate Visual Tracking with Target Estimation Guidelines》论文笔记
参考代码:video_analyst1. 概述导读:这篇文章指出之前的一些跟踪算法没有深入讨论针对跟踪任务的实质,很多时候只是在某些点上进行突破,因而最后方法的性能总是有局限性的。对此文章深入分析了跟踪网络的特性,因而对跟踪网络的设计提出了4点建议:G1(目标位置估计和目标判别需要接耦,分别具有各自的分支)/G2(目标判别置信度不能与实际相模糊)/G3(不能依赖数据分布等先验知识,否则导致泛化性鲁棒性不强)/G4(目标位置的估计应该准确)。正是基于上的4点设计指导,文章设计了SiamFC++网络,在5
2021-03-19 00:04:49 863 2
原创 《ATOM:Accurate Tracking by Overlap Maximization》论文笔记
参考代码:pytracking现有的跟踪网络很多都着力于将目标从背景中区分开来,也就是提升前景背景的分辨能力,但是目标位置的准确性(跟踪框于实际目标的重合度)却被低估了,这也就导致了下图1中出现的目标定位位置并不准确的问题。对此文章提出了一个新的跟踪方法ATOM,它由两部分组成:目标位置估计和目标辨别。目标位置估计参考了IoU-Net的位置回归思路(因而在读这篇文章之前需要先搞懂IoU-Net的工作原理),将其移植到了跟踪网络中,因为该任务需要高层级的语义信息用以预测IoU值,因而并不适合在线训练,从而文
2021-03-18 00:24:34 423
原创 《MODNet:Is a Green Screen Really Necessary for Real-Time Portrait Matting?》论文笔记
参考代码:MODNet1. 概述导读:这篇文章提出了一种trimap-free的matting方法,其matting的过程是一个将原图像拆分与组合的过程,这也是文章方法很大的优势。在文章中将matting的过程划分为三个部分:整图目标区域语义信息提取(semantic estimation)/半透明区域细节优化(detail prediction)/语义信息与细节信息的融合预测(semantic-detail)。一般的matting模型会在训练集上表现出过拟合的特性,导致其在真实的环境下性能表现不佳,
2021-03-16 13:15:35 1030
原创 《Background Matting V2:Real-Time High-Resolution Background Matting》论文笔记
主页:background-matting-v2参考代码:BackgroundMattingV21. 概述导读:这篇文章在之前V1版本(在512*512输入的情况下只能跑到8FPS)的基础上针对高分辨率(HD,4K画质)提出了一种设计巧妙的matting方法,文章将其称之为之前方法的V2版本。该方法中将整个pipeline划分为两个部分:base和refine部分,前一个部分在缩小分辨率的输入下生成粗略的结果输出,其主要用于提供大体的区域位置定位(coarse predcition)。后一个网络在该
2021-03-03 13:15:27 4887 5
原创 《Background Matting:The World is Your Green Screen》论文笔记
主页:background-matting参考代码:Background-Matting1. 概述导读:这篇文章对于自然场景下人像抠图提出了一种新的matting方法,在该方法中引入一张背景图片作为参考,此后尽量保持背景画面不动(手持设备存在合理的抖动也可以),将语义分割模型的分割结果/前后帧(可选)也引入作为额外的依据信息。为了使这些信息能够发挥最大的作用,文章引入了一个CS(Context Switching block )模块去有效选取有用信息,从而经过解码器之后得到更加准确的matting结
2021-03-02 13:06:46 700
Opencv调试看图插件
2016-10-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人