论文阅读KMN：Kernelized Memory Network for Video Object Segmentation

汐梦聆海

于 2020-09-14 22:00:18 发布

阅读量1.5k

点赞数 3

分类专栏： VOS 半监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jackzhang11/article/details/108588150

版权

这篇论文发表在ECCV2020上面，是对于STM的改进。STM存在一个缺点，就是在做query和memory的key之间的matching时，将所有的情况都建立了联系，这种处理是一种non-local的方式，而VOS问题大多数情况下是一种local的情况。所以作者提出了一种Kernelized Memory Network（KMN）来解决这一问题；此外作者还采用了一种Hide-and-Seek策略（17年ICCV一篇若监督的论文），在预训练时人为地对图像的某些区域进行遮挡，以提升物体遮挡识别的鲁棒性。

在这里插入图片描述
上图中上半部分是传统的STM，他只是用query去匹配memory，这种non-local的匹配方式很可能造成query中多个目标匹配memory中同一个目标的问题。由于帧之间的幅度很小，所以显然我们要追踪的目标在上一帧mask附近，而不会离他太远。因此VOS是一个local的问题。在作者加入了一个Gaussian Kernal的约束后，就变成了一种适用于VOS的local的solution。

在这里插入图片描述
如上图，整个流程结构与STM是完全一样的，只有紫色的Kernalized Memory Read部分有所改动。

首先是STM中的流程&

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。