打卡第4天

最新推荐文章于 2024-09-25 00:15:50 发布

yahaha0v0

最新推荐文章于 2024-09-25 00:15:50 发布

阅读量61

点赞数

文章标签：计算机视觉深度学习 cnn Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27719195/article/details/128927823

版权

文章探讨了目标检测的基础，从早期的滑动窗口方法到密集预测的演变，包括两阶段和单阶段方法。提到了anchor在解决物体尺度和重叠问题中的作用，以及Transformer在该领域的应用。还讨论了置信度、NMS、IOU等关键概念，并触及了正负样本不平衡问题和FocalLoss作为解决方案。

摘要由CSDN通过智能技术生成

目标检测基础

范式演化

滑动窗口：

将原图的多个窗口切片独立重复进行卷积的操作，替换成对整张原图进行卷积，然后再用窗口提取局部区域，后续仍用FC预测概率。隐含的意义在于：

不同窗口之间可能会有重复区域，反复进行独立的卷积，且用的是相同的卷积核，浪费计算量

（也可能是，通过卷积将像素级的信息，进一步凝练？）

密集预测：

对特征图的每个像素，进行1x1的卷积，以替代全连接，将特征图转换为概率图。

对每个像素都进行预测，即为密集预测

方法论：

两阶段方法：

先产生窗，再基于窗内的特征进行预测

单阶段方法：

对特征的单点特征实现密集预测（能不能考虑融合其它信息）

分类：

基于anchor：解决物体重叠和不同大小

anchor-free

Transformer方法

基础知识：

置信度：

置信度可能与IOU有关？置信度越高，则IOU越大？并不一定，但很可能

NMS：

逐步从置信度最高的预测里，进行IOU的比较，来找到质量最好的框

IOU是实际指标，置信度是网络预测

人们应该比较期望置信度与IOU趋势一致，但无法严格保证

边界框编码：

绝对偏移量数值较大，难以预测

推理时，还需要逆向解码

区域提议：

基于特征作二分类，仅判断其内是否存在物体，从而实现区域提议

问题：

物体尺度不一

不同物体存在重叠

改进：

anchor：

不同尺度，多个提议框

多个类别：单阶段网络

正负网络不均衡问题：模型偏向背景预测

Focal Loss

未完待续...

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

yahaha0v0 CSDN认证博客专家 CSDN认证企业博客

码龄9年

4: 原创

173万+: 周排名

165万+: 总排名

395: 访问

: 等级

46: 积分

1: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

打卡第一课
yahaha0v0: 谢谢！
打卡第一课
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。