计算机视觉_目标检测_part1

最新推荐文章于 2024-01-06 16:55:53 发布

-Wave

最新推荐文章于 2024-01-06 16:55:53 发布

阅读量290

点赞数

分类专栏：目标检测文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44092937/article/details/106806594

版权

目标检测专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Methods

1.空洞卷积

下图中，右边为空洞卷积。
在这里插入图片描述

2.转置卷积

在这里插入图片描述

目标检测

1.传统的目标检测方法

滑动窗口法+传统机器学习分类器
滑动窗口即有一个窗口在图片上进行滑动，然后检测这个窗口里有没有object。
缺点：识别效果不好，准确率不高；计算量较大，运行速度慢；且可能出现多个正确识别的结果。

2. 滑动窗口法则＋CNN

CNN可以提高识别的准确率。

全卷积神经网络FCN

我们知道对于一个各层参数结构都设计好的神经网络来说，输入的图片大小是需要固定的，如图AlexNet,VGGNet,GoogleNet等网络都需要输入固定大小的图片才能正常工作。
在这里插入图片描述
FCN的精髓：让一个已经设计好的网络可以输入任意大小的图片。

14 * 14的窗口，最后得到一个输出结果。
16 * 16的窗口，最后得到四个输出结果。
在这里插入图片描述
ps： 1616的output中的蓝点，代表的是input中1414的蓝色区域的检测结果。
如下，红点对应于红色区域：

过程

在这里插入图片描述
我们最终得到一张特征图，其实就是我们的滑动窗口64次下来的结果。

交并比

在这里插入图片描述

mAP(mean average precision) 平均准确率的均值

而多标签图像分类任务中的图片的标签不止一个。
比如，一个图像它有标签‘人’，也有标签‘女人’。
ps：关于precision 和recall：
Precision其实就是在识别出来的图片中，True positives所占的比率；
Recall 是被正确识别出来的飞机个数与测试集中所有飞机的个数的比值；

https://blog.csdn.net/liuweiyuxiang/article/details/80111226
在这里插入图片描述
举例

（1代表是猫，0代表不是猫）

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

-Wave CSDN认证博客专家 CSDN认证企业博客

码龄6年

90: 原创

32万+: 周排名

74万+: 总排名

4万+: 访问

: 等级

1100: 积分

19: 粉丝

63: 获赞

5: 评论

103: 收藏

私信

关注

热门文章

分类专栏

最新评论

python入门_day13_chap12_游戏项目_飞船移动且不超边缘
m0_65069586: 我按照这样写的，但并未限制飞船运动
python入门_day13_chap12_游戏项目_飞船移动且不超边缘
m0_71769324: 请教一下，如果飞船距离屏幕右边缘距离为1，但设置的飞船移动速度为5，此时按下右键，飞船只移动1，即与屏幕右边缘贴合，是哪名代码保证飞船不会直接向右移动5个坐标从而跑到屏幕外面？按我的理解，代码“if self.moving_right and self.rect.right<self.screen_rect.right”是在按下键盘后，在将飞船X坐标调增前做的检查，由于X坐标调增前，飞船X坐标是小于屏幕右边缘的X坐标的，理论上飞船仍然会向右移动设置的距离的，还请大侠指教，不甚感激。
Pytorch实现GAN之生成手写数字图片
TL、强: 非常感谢分享！能够拿来学习使用的代码才是好代码
三层神经网络的实现
龙卷风焦96: 生物计算机技术是不是就能实现神经网络
一个简单的神经网络（不调用numpy或其他库函数实现）
weixin_46424801: 👏👏👏🌹🌹🌹

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。