【论文笔记】An Analysis of Scale Invariance in Object Detection - SNIP （二）

最新推荐文章于 2022-10-27 22:21:27 发布

weixin_34404393

最新推荐文章于 2022-10-27 22:21:27 发布

阅读量108

点赞数

文章标签：人工智能

原文链接：https://juejin.im/post/5c4c1b7af265da61380f90f7

版权

Object Detection on an Image Pyramid

Scale Normalization for Image Pyramid

SNIP是由MST修改而来的模型，在上一节中作者指出MST效果不好的原因在于无法识别过大或过小的目标，而在SNIP中，我们使用224x224的分辨率（与pre-training的分辨率相近）来训练检测器。

SNIP在训练过程中只对特定尺度范围内的目标回传损失，但不对数据集进行过滤处理，是的模型能够补货所有appearnce和pose细节，从而减小了domain-shift带来的影响。

特定尺度范围是与pre-training数据相近的尺度，即224x224。

**注：**MST进行多尺度训练，因为一个物体总会有一个尺度落在指定范围内，只有这个落在指定范围内的物体参与了训练，其余部分在BP时忽略。

由Table1可以看出，SNIP与其他方法相比是优秀的。

SNIP示意图如下所示：

RPN训练

用所有的ground truth boxes给anchors和proposals分配标签。
对一个特定分辨率i下，定义范围[sc_i, ec_i]，RoI落入此范围内的ground truth boxes记为valid，其余为invalid。
将与invalid_GT的RoI超过0.3的anchors标记为invalid anchors。

在测试阶段，用RPN生成各个分辨率下的proposals，并各自分类，与训练时相同，丢弃不在特定范围内的detections（not proposals）。

最后用soft-NMS讲个分辨率下的detections相加，得到最终结果。

Sampling Sub-images

考虑到GPU的显存限制，需要对图片进行crop。

用最少数量的chips（sub-images），1000x1000，来囊括所有小目标。如果没有小物体就不需要计算，从而达到加速目的。
1400x2000的图片进行采样，800x1200和480x640的途中没有小物体时不需要采样。

weixin_34404393

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文笔记】An Analysis of Scale Invariance in Object Detection - SNIP （二）

Object Detection on an Image PyramidScale Normalization for Image PyramidSNIP是由MST修改而来的模型，在上一节中作者指出MST效果不好的原因在于无法识别过大或过小的目标，而在SNIP中，我们使用224x224的分辨率（与pre-training的分辨率相近）来训练检测器。SNIP在训练过程中只对特定尺度范围内的目标...
复制链接

扫一扫

weixin_34404393 CSDN认证博客专家 CSDN认证企业博客

码龄8年

136: 原创

-: 周排名

44万+: 总排名

125万+: 访问

: 等级

7240: 积分

4183: 粉丝

224: 获赞

24: 评论

1064: 收藏

私信

关注

热门文章

最新评论

原码,补码
做而论道_CS: 计算机，有 8 位机、16 位机、...。每次运算，也就只用到 8、16 位二进制数。而且，计算机中，也只有加法器。那么，45－45 = 0，八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！
原码,补码
做而论道_CS: 其实，补码的原理，与 “取反加一” 毫无关系。补码的来源，可以用十进制来说明。假定，只使用两位数：0~99。此时，－1 就可以用 +99 代替。如：24－1 = 23 　　24 + 99 = (一百) 23 忽略进位，只取两位，这两种算法，功能相同。三角函数中，也有：－90° 与＋270° 等效。重点：　限定位数（或范围）后，数值变化就有了周期性。　正数（补码），就可以代表负数；　加法，就可以代替减法。因此：　学会了加法，就可走遍天下。
原码,补码
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。没有原码，拿什么取反？没有反码，拿什么加一？
原码,补码
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。没有原码，拿什么取反？没有反码，拿什么加一？其实，补码的原理，与 “取反加一” 毫无关系。补码的来源，可以用十进制来说明。假定，只使用两位数：0~99。此时，－1 就可以用 +99 代替。如：24－1 = 23 　　24 + 99 = (一百) 23 忽略进位，只取两位，这两种算法，功能相同。三角函数中，也有：－90° 与＋270° 等效。【限定位数（或范围）后，数值变化就有了周期性。】　正数（补码），就可以代表负数；　加法，就可以代替减法。　因此，学会了加法运算，就可走遍天下。计算机，有 8 位机、16 位机。每次运算，也就只用到 8、16 位二进制数。而且，计算机中，只有加法器。那么，45－45 = 0，八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！－－－－－－－－－－－－－－－－－实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。 0 ＋ X，不就是 X 吗？即，正数的补码，就是 X 本身！－－－－－－－－－－－－－－－－－在现代计算机中，只有加法器，只能使用补码。所以，在计算机中，只有补码，并没有原码和反码。不存在的东西，学它干嘛呢？计算机老师，指望这个混饭吃呗。顺便，再抓几个不及格的，抖一下威风！真值机器数符号位原码反码取反加一符号位不变模同余 ... 专家写的这些，明显就是【拿个鞋拔子当做玉如意】。假货，不仅仅在古董行业才有啊！
WPF特效-实现弧形旋转轮播图
sadfasdfsadf: 兄弟有源码吗分享下

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。