小目标检测的一些理解

请设置你的昵称

于 2018-10-24 15:41:15 发布

阅读量6.1k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38440272/article/details/83269361

版权

干货：目标检测

cvpr 代码

1.小目标检测需要高分辨率

可以提高输入分辨率

SSD对高分辨率的底层特征没有再利用，但底层特征的语义信息少，这两个互相矛盾。

另外SSD的anchors设计为0.1~0.2，最小的anchors大小为72，还是太大了。

2.feature map不能太小

卷积网络的最后一层的feature map不能太小。卷积网络越深，语义信息越强，越底层是描述局部外观信息越多。

3.可以多尺度检测

4.多尺度特征表示

解决小目标检测问题的一般方法：提高输入图像的分辨率，会增加运算量；多尺度特征表示，结果不可控

全卷积网络：

FCN可以接受任意尺寸的输入图像，与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类（全联接层＋softmax输出）不同。采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸，从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。

CNN的强大之处在于它的多层结构能自动学习特征，并且可以学习到多个层次的特征：

较浅的卷积层感知域较小，学习到一些局部区域的特征

较深的卷积层具有较大的感知域，能够学习到更加抽象一些的特征

高层的抽象特征对物体的大小、位置和方向等敏感性更低，从而有助于识别性能的提高, 所以我们常常可以将卷积层看作是特征提取器

将全连接层转为卷积层：

将滤波器的尺寸设置为和输入数据体的尺寸一致, 这样输出就变为, 本质上和全连接层的输出是一样的

请设置你的昵称 CSDN认证博客专家 CSDN认证企业博客

码龄8年

52: 原创

8万+: 周排名

150万+: 总排名

7万+: 访问

: 等级

1245: 积分

21: 粉丝

16: 获赞

19: 评论

108: 收藏

私信

关注

热门文章

分类专栏

vos 1篇
微信小程序
python爬虫 2篇
open-cv 1篇
c++ 1篇
python 4篇
linux 4篇
机器学习 2篇
深度学习 12篇
NLP 2篇
blockchain 1篇
题目 3篇
image caption 6篇
segmentation 5篇
pytorch 2篇

最新评论

mac ssh连接windows
enchanted_z: 请问乱码问题解决了嘛～
视频物体分割（Video Object Segmentation）综述
V.Guan: 从给定的第一帧的掩码中提取，掩码中每个不同目标的标注是不一样的。比如有两个目标，第一个的像素值假设为1，第二个为2，那么令mask=1可以提取第一个目标，mask=2提取第二个目标，最后将预测结果再相加得到多目标预测掩码。
基于truffle的一个DApp——pet-shop
wennwennn: 请问博主改了哪里啊，我也遇到了这个问题，不知道怎么解决
lightGBM 双高
chandelierds: 麻烦问下best iteration是第一次训练这个问题，楼主是如何解决的？
视频物体分割（Video Object Segmentation）综述
青灯黄卷纯音乐_: 您好，我一直不太清楚半监督的VOS方法是怎么对多物体进行分割的，我看好多论文都提到过多物体分割是进行多次分割，每次分割一个，然后做aggregate，但是我始终不明白是怎么一次对一个object做分割的？是怎么把这个object的特征从多个object的特征中抠出来的？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。