目标检测论文笔记 2019.11

最新推荐文章于 2023-03-29 23:14:31 发布

ClarissaYL

最新推荐文章于 2023-03-29 23:14:31 发布

阅读量859

点赞数

分类专栏：目标检测文章标签：目标检测论文笔记

本文链接：https://blog.csdn.net/qq_41614538/article/details/103214956

版权

初入门目标检测，近两个月看的一些论文笔记汇总。
尽量用简单的语言概括论文的思想，提出highlight，具体实现细节参考各论文。

阅读日期：2019.11.21

Highlight

MOCO

unsupuvised visual representation learning
buiding large and consistent dictionary
- Dictionary as Queue: 解耦dict大小与mini-batch大小，使得dict可以足够大，不受制于内存
- Momentum update: 逐渐更新key encoder的模型参数，保持queue中keys的一致性
shuffling BN：多块GPU各自进行BN。在key_encoder进行编码前，先shuffle minibatch，编码完后shuffle back，而query_encoder不进行shuffle，保证两者进行BN用的batch信息不来自同一组batch，避免intra-batch信息泄漏，使模型过于容易找到一个low-loss solution，而representation的提取却不够general.

算法流程

contrastive loss: similarity of sample pairs in representation space

$L_q = -log{exp(q·k_+/\tau) \over \sum_{i=0}^K exp(q·k_i/\tau)}$

阅读日期：2019.11.22

Highlight

在faster-RCNN上做了微小改动，添加一个head用于预测binary mask，实现实例分割，5FPS。还可以被拓展用于keypoint检测任务，把每个关键点作为一个one-hot mask.
提出RoI Align，通过双线性插值，避免量化，使提取的特征更好地保持原图位置信息，这一点对生成准确的mask非常重要，而分类任务则对位置信息更鲁棒一些。
解耦classification和segmentation，对每个类别都分别预测一个binary mask，避免类别竞争

Models Per pixel Loss

解耦 Mask RCNN sigmoid BCE

竞争 traditional FCN