OverFeat,分类、定位、检测

最新推荐文章于 2023-12-08 19:25:05 发布

Handy521

最新推荐文章于 2023-12-08 19:25:05 发布

阅读量413

点赞数

分类专栏： paper comprehension 文章标签： object detection

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Handy521/article/details/89035444

版权

paper comprehension 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1、视觉任务

分类任务，每张图片安排一个标签联系图片上的主要物体；定位任务，一个边界框预测对象返回一个类比，必须和GT 的IoU>0.5;检测任务每个图像中可以有任意数量的对象，FP通过mAp惩罚。

3.3多尺度分类测试

每个location多个尺度通过一个全卷积网络，每个尺度输出一个C-dimensional向量。

输入图片6个尺度再加上水平翻转输入网络，unpool层增广，池化过程增加一个偏移量，1个维度上输出3种池化结果，两个维度就是（3*3），假设layer5为1*20，输出层就为1*2，增加偏移量之后，输出层为1*6，每个格子内为1000类别向量。

二维从a->e:20*20*num——>6*6*9*256-->2*2*9*C-->2*2*9*C,求最后的输出类别，池化之后输出是原来的9倍（i）取每个格子中1000向量的最大值（ii）从多个尺度和翻转得出的C-dim向量，求平均值，？？？输出尺度不一样（iii）根据平均向量取top1或top5。

每张图片输入6个尺寸还水平翻转，卷积核大小5*5，步长为3 (17-5+2P+1)/3=5

4定位

同时运行分类器和回归定位任务，只是最后一层计算不同，最终输出层4个边界框坐标。如上表第一个尺度输出3*3*4，在原图上画9个框，并标记1000向量最大类别的得分，上表第二个尺度6*9*4，如下图为最后输出维度

4.3 合并框（类似于非极大值抑制）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OverFeat,分类、定位、检测

1、视觉任务分类任务，每张图片安排一个标签联系图片上的主要物体；定位任务，一个边界框预测对象返回一个类比，必须和GT 的IoU>0.5;检测任务每个图像中可以有任意数量的对象，FP通过mAp惩罚。3.3多尺度分类测试每个location多个尺度通过一个全卷积网络，每个尺度输出一个C-dimensional向量。输入图片6个尺度再加上水平翻转输入网络，unpool层增广，池化...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。