细粒度目标检测问题剖析

最新推荐文章于 2024-07-30 23:59:56 发布

ctoLu

最新推荐文章于 2024-07-30 23:59:56 发布

阅读量1.6k

点赞数 11

文章标签：目标检测人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/star__01/article/details/136289391

版权

本文探讨了细粒度目标检测中的挑战，如类内差异大和类间差异小，介绍了R-CNN在细粒度识别中的优势以及YOLO和SSD的适用场景。着重讨论了数据集获取、增强方法（包括有监督和无监督）、标注工具以及影响分类识别的关键因素。

摘要由CSDN通过智能技术生成

问题剖析

相对于一般目标检测任务，细粒度目标更容易出现类内差异大、类间差异小等现象。

所谓细粒度目标识别，是指在目标检测的基础上，识别出目标的具体型号与类别，例如不只识别出飞机目标，还能识别出飞机型号。粗粒度是分辨猫还是狗，而细粒度是分辨狗的种类，比如这个狗是杜宾犬还是金毛。

基于深度学习的细粒度目标检测算法研究

LionRoarRoar/Awesome-Fine-grained-Visual-Classification: Awesome Fine-grained Visual Classification (github.com)

Awesome Fine-Grained Image Analysis – Papers, Codes and Datasets (weixiushen.com)

目标识别算法选择

对于细粒度物体识别，通常来说，R-CNN更适合。R-CNN是一种基于区域的卷积神经网络，它在检测和识别物体时能够更好地捕捉物体的细节和特征。相比之下，YOLO更适合于快速的实时物体检测，但在细粒度物体识别上可能不如R-CNN表现出色。

1、yolo

不生成预选框

2、R-CNN

先生成备选框，后分类，修正，识别

3、SSD

4、多模型融合

将每个模型的预测结果进行融合，可以采用简单的投票机制、加权平均或者更复杂的集成学习方法来融合这些结果。
调整融合权重：根据实际情况，可能需要对不同模型的预测结果进行加权融合，以提高整体预测性能。

数据集获取

训练集、验证集、测试集

堆数据

1、爬虫

1、多搜索引擎爬取

2、筛选去重

颜色特征提取
纹理特征提取
SIFT特征对比

2、数据增强

目的：

执行数据增强，你可以阻止神经网络学习不相关的特征，从根本上提升整体性能。

方法：

有监督：

翻转，旋转，缩放，裁剪，移位；

可能的问题：旋转特定角度出现黑色区域 -> 插值

无监督:

通过模型学习数据的分布，随机生成与训练数据集分布一致的图片，代表方法GAN。
通过模型，学习出适合当前任务的数据增强方法，代表方法AutoAugment。

自动数据增强https://github.com/tensorflow/tpu/blob/master/models/official/detection/utils/autoaugment_utils.py

可能出现的问题：

过度拟合 -> 高斯噪声

样本不平衡问题

图片标注

标注工具：labellmg

影响分类识别的因素

可以归结为三个方面：

第一种因素，就是比较常见的基于图像本身的一些因素，比如光照，形变，尺度，模糊等等。
第二种因素，就是类内差异太大，比如椅子，桌子，虽然都叫椅子，桌子，可是形态各异。
第三种因素，就是类间差异太小，最常见的就是细粒度分类。

缩小类内距离增大类间距离策略——摘自知乎（作者：新想）_多分类损失函数优化类间距离大-CSDN博客

如何保持分类模型具有类内聚敛、类间分离的特性？ - 简书 (jianshu.com)

triplet loss
L-softmax
A-softmax
Am-softmax
centerloss
LDA

关注

11
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ctoLu CSDN认证博客专家 CSDN认证企业博客

码龄1年

41: 原创

105万+: 周排名

13万+: 总排名

5万+: 访问

: 等级

1677: 积分

1167: 粉丝

1345: 获赞

22: 评论

786: 收藏

私信

关注

热门文章

分类专栏

最新评论

改进神经网络
征途黯然.: This 改进神经网络 article is truly great and very insightful.
改进神经网络
全栈小5: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文【改进神经网络，博主这篇文章，值得一看】
改进神经网络
小明: 非常不错的技术领域文章分享，内容很丰富，博主很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，值得收藏点赞

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。