分割 标注数据_CVPR2020 | RPMNet | 像素级目标分割网络结构,无需人工标注数据,通过自监督训练,接近全监督算法。...

论文地址:https://arxiv.org/abs/1909.13247

来源:韩国技术学院

论文名称:RPM-Net: Robust Pixel-Level Matching Networks for Self-SupervisedVideo Object Segmentation

原文作者:Youngeun Kim

      本文提出了一种可以不需要人工标注数据集的自监督视频目标跟踪算法。明确的说,本文提出了一种鲁棒的像素级的匹配网络(RPM-Net),该深度学习框架通过颜色信息对相邻帧的图像信息进行像素级别的匹配,并且该算法在训练过程不需要人工标注的数据集。实际上RPM-Net可以被分为两个主要的模块。首先,嵌入模块,将输入的图像数据映射到高维的嵌入空间中。然后,匹配模块使用可变卷积层对提取的嵌入特征进行操作,实现当前帧和目标帧之间的像素匹配。与以往使用可变形卷积的方法不同,该匹配模块采用可变形卷积来在时间和空间对相邻像素中的相似特征进行匹配。实验表明,本文算法提取的特征提高了对摄像机抖动、快速运动、变形和遮挡等视频目标分割问题的鲁棒性。同时在三个公开的数据集( DAVIS-2017、SegTrack-v2 andYoutube-Objects)上进行了综合测试,算法在自监督视频目标分割领域表现SOTA。并且该算法显著的减小了自监督和全监督视频目标分割算法之间的差距(在DAVIS-2017的验证集上分别为41.0%和52.5%)。

下面是论文具体框架结构以及实验结果:

93530270531794e7d525deaa0480f832.png

c601d4bde6dbd968d8aa4c0babf2db8a.png

284cc9c4f517adc8b2eeac29da6583c4.png

239d430347562d5c65e1541c1d662430.png

e92a90ea5b4b3595e27522e8dfa9b9ff.png

1e082997ffc7ed931744916f64ed0446.png

5f5938b760eff48c39ea5577cad87dee.png

b17de4a0e6f564af61033bad39b09bf5.png

5447450cd4ca4a447189d683fe26b71e.png

57ad11fe98f5dde06a486dd91b14d03a.png

1b8793d782b923b61b624cbadf648d22.png

8e4cd081b565ceb4d2bf91d59eb3d9e0.png

声明:文章来自于原作者公开发表的论文,仅用于学习分享,版权归原作者所有,侵权请联系删除,微信:cly15600665922。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值