【深度学习与神经网络】目标检测及语义分割

最新推荐文章于 2024-07-30 16:33:41 发布

远离debug

最新推荐文章于 2024-07-30 16:33:41 发布

阅读量806

点赞数 9

文章标签：深度学习神经网络目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74788218/article/details/137874075

版权

本文探讨了目标检测中的滑动窗口问题，重点介绍了YOLO（YouOnlyLookOnce）的一步法解决策略，包括其网络结构、输入处理、输出和置信度计算。同时，对比了语义分割，强调了FCN（FullyConvolutionalNetworks）在图像像素分类中的应用和评价指标。

摘要由CSDN通过智能技术生成

目标检测

目标检测问题

目标检测是在给定的图片中精确找到物体所在位置，并标注出物体的类别。物体的尺寸变化范围很大，摆放物体的角度，姿态不定，而且可以出现在图片的任何地方，并且物体还可以是多个类别。

基本思想

滑动窗口

问题1：滑动次数太多，计算太慢

问题2：目标大小不同，每一个滑动位置需要用很多框

改进：一步法（YOLO）

一步法

基本思想：将分类问题扩展为回归+分类问题

YOLO

网络结构

网络结构包含24个卷积层和2个全连接层；其中前20个卷积层用来做预训练，后面4个是随机初始化的卷积层，和2个全连接层。

YOLO网络输入

YOLO v1在PASCAL VOC数据集上进行的训练，因此输入图片为448 × 448 × 3。实际中如为其它尺寸，需要resize或切割成要求尺寸。

YOLO模型处理

将图片分割为 𝑆2个grid(𝑆 = 7)，每个grid cell的大小都是相等的；

每个格子都可以检测是否包含目标；

YOLO v1中，每个格子只能检测一种物体（但可以不同大小）。

YOLO网络输出

输出是一个7 × 7 × 30的张量。对应7 × 7个cell；

每个cell对应2个包围框(bounding box, bb)，预测不同大小和宽高比，对应检测不同目标。每个bb有5个分量，分别是物体的中心位置(𝑥, 𝑦)和它的高(ℎ) 和宽 (𝑤) ，以及这次预测的置信度。

YOLO包围框

我们有 𝑠2个框，每个框的bb个数为𝐵，分类器可以识别出𝐶种不同的物体，那么所有整个ground truth的长度为𝑆 × 𝑆 × (𝐵 × 5 + 𝐶)

YOLO置信度

$C=Pr(obj)*IOU_{truth}^{pred}$

$Pr(obj)$ 是一个grid有物体的概率

$IOU$ 是预测的bb和真实的物体位置的交并比

YOLO损失函数

语义分割

语义分割问题

找到同一画面中的不同类型目标区域

语义分割 vs 实例分割 vs 目标检测

实例分割：同一类型目标要分出来具体实例（谁是谁）

目标检测：标出来外包围矩形

深度学习图像分割算法

语义分割目标

对图中每个像素进行分类，得到对应标签

基本思想：滑动窗口

FCN网络结构

网络结构分为两个部分：全卷积部分和反卷积部分。全卷积部分借用了一些经典的CNN网络，并把最后的全连接层换成卷积，用于提取特征，形成热点图；反卷积部分则是将小尺寸的热点图上采样得到原尺寸的语义分割图像。

卷积部分

FCN中第6、 7、 8层都是通过1 × 1卷积得到的，第6层的输出通道是4096，第7层的输出通道是4096 ，第8层的输出是1000（类） ,即1000个特征图（称为heatmap）

反卷积部分

为跳级结构

评价指标

像素准确率

$\frac{\sum_i{n_{ii}}^{}}{\sum_i{t_{i}}^{}}$

平均准确率

$\frac{1}{n_{cls}^{}}\cdot \sum_{i}^{}\frac{n_{ii}^{}}{t_{i}}$

平均交并比

$\frac{1}{n_{cls}}\cdot \sum_{i}^{}\frac{n_{ii}}{t_i+\sum_{j}^{}n_{ij}-n_{ii}}$

关注

9
点赞
踩
10

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

远离debug CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

173万+: 周排名

19万+: 总排名

2811: 访问

: 等级

86: 积分

45: 粉丝

42: 获赞

5: 评论

59: 收藏

私信

关注

热门文章

最新评论

【深度学习与神经网络】目标检测及语义分割
ha_lydms: 这篇博客让我对于之前的一些观念产生了怀疑，作者的观点非常独到。
【深度学习与神经网络】目标检测及语义分割
全栈小5: 文章结构严谨，每次阅读都能收获知识，感谢博主的分享，期待博主继续更新高质量文章，支持！【【深度学习与神经网络】目标检测及语义分割，博主这篇文章，值得一看】
【深度学习与神经网络】目标检测及语义分割
CSDN-Ada助手: 恭喜你在深度学习与神经网络领域又发布了一篇博客！标题“目标检测及语义分割”听起来非常有趣，这两个主题都是当下研究热点。希望你能继续保持创作的热情和努力，不断探索更多深度学习相关的内容。或许下一步可以尝试探讨一些实践经验或者案例分析，让读者更容易理解和应用你所讲述的知识。期待你更多精彩的分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
【深度学习与神经网络】卷积神经网络
CSDN-Ada助手: 非常棒的博文！深度学习与神经网络是当今研究的热点领域，而卷积神经网络作为其中的重要分支，具有很高的应用价值。你在博文中提到了多层感知机的限制，着实让人眼前一亮。继续保持写作的热情和创作力！另外，关于卷积神经网络，你可以进一步了解一下不同的卷积核的作用和设计、池化层的种类以及正则化技术的应用等内容，这些知识对于深入理解卷积神经网络会有很大帮助。期待看到你更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
【神经网络与深度学习】BP算法学习
CSDN-Ada助手: 恭喜您开始了博客创作！神经网络与深度学习是一个非常有趣和复杂的领域，而BP算法学习也是其中的重要一环。希望您能够坚持不懈地深入研究，不断学习和探索，为读者带来更多有价值的内容。建议您在未来的创作中，可以结合实际案例或者应用场景，让读者更容易理解和接受您的知识分享。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。