CornerNet

xiaochengJF

于 2020-11-08 11:15:41 发布

阅读量174

点赞数

分类专栏：目标检测文章标签：计算机视觉深度学习卷积神经网络目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43711554/article/details/109471513

版权

目标检测专栏收录该内容

41 篇文章 1 订阅

订阅专栏

论文：CornerNet: Detecting Objects as Paired Keypoints（CVPR 2018）速达>>
代码：princeton-vl/CornerNet

文章目录

动机

Anchor缺点：

大部分和目标框几乎没有重叠，导致正负样本失衡
引入的参数较多（Box数量、尺寸、纵横比）

将关键点检测的方法加以改造，用于目标检测任务

Corner Detection

关键点位置通常带有语义信息，如下图关键点7 就是在汽车右边后轮上，关键点7 在前面右车灯处

在这里插入图片描述

而目标框顶点不同于普通的关键点，顶点处语义信息不明，一般都在目标区域外边，如下图：

在这里插入图片描述
让目标框顶点与目标建立桥梁，如上图最左边的人：头顶上画一条横线，左手边上画一条竖线，两线相交即为左顶点。Corner Pooling相当于在划线，这样目标的语义信息就与定点位置联系起来了（注意：这里只是建立联系，不是最终预测）
在这里插入图片描述
具体示例：计算四个左顶点得分，

在这里插入图片描述
最终的预测模块如下所示：

如何评估预测的定点位置，当然是与标签框定点的距离，目标框顶点处位置处值 $y_{cij}=1$ ，在一定范围内预测位置偏离越远 $y_{cij}$ 越小（文中假设服从Gaussian分布，范围划定为一个圆圈，半径根据圆圈内顶点组成的框与目标框IOU是否大于0.7设定），超出范围直接打 0 分就可以了

在这里插入图片描述
位置损失采用修改版的 Focal Loss：

在这里插入图片描述
其中， $N$ 表示图片中目标数量， $\alpha$ 和 $\beta$ 为超参数

将 Heatmap 重新映射会输入图像时，会有精度损失，所以预测模块还有一个 Offset map，预测偏移量：
在这里插入图片描述
采用 Smooth $L_1$ Loss：

Grouping Corners

怎么确定预测的左顶点和右顶点是一个目标的？

预测模块还会预测一个 Embeddings map，每个像素点（位置和预测的顶点相对应）就是一个Embedding Vector，同一个目标的两个顶点对应的 Embedding Vector 的距离应该较小，根据距离即可判断是否为同一个目标上的顶点了

Embedding 损失由两部分组成：

$\mathcal L_{pull}$ ：同一个目标的关系要拉近(pull)
$\mathcal L_{push}$ ：不是同一个目标的远离(push)

在这里插入图片描述
其中， $e_{t_k}$ 表示目标 $k$ 对应的预测左顶点， $e_{b_k}$ 表示目标 $k$ 对应的预测右顶点， $e_k$ 表示 $e_{t_k}$ 和 $e_{b_k}$ 的平均， $\Delta$ 设为1

Hourglass Network

在这里插入图片描述

在这里插入图片描述
$【 4 】$

相关实验

在这里插入图片描述

参考文献

【1】CornerNet
【2】CornerNet算法解读
【3】CornerNet 算法笔记
【4】Stacked Hourglass Networks for Human Pose Estimation(论文)
【5】DenseBox

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CornerNet

论文：CornerNet: Detecting Objects as Paired Keypoints（CVPR 2018）速达>>
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。