分类&定位简述

最新推荐文章于 2022-05-03 18:33:44 发布

朱小丰

最新推荐文章于 2022-05-03 18:33:44 发布

阅读量482

点赞数

分类专栏：分类定位文章标签：分类定位

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41866216/article/details/100650433

版权

分类同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

分类

1二分类：是猫？不是猫？

多分类：是猫？是狗？是羊？

2深度分类网络 = 特征提取层+分类器

3softmax

4损失函数就交叉熵损失

5分类的两种结构：全连接：flatten操作卷积：squeeze操作（把维度为1的列去掉）

卷积方式输入尺寸可不固定

定位

1定位的两种方式：滑动窗口改造的卷积神经网络

2滑动窗口：我们通过不断的一个不断滑动的窗口来截取图片中的一部分，并放入分类模型中进行识别，返回所属分类的概率值。

3使用改造的卷积网络

以VGG网络为例网络最后输出是1*1*4096 这里的4096代表图片属于中物体属于不同类别的概率。

我们改造VGG网络使其输出为7*7*4096 这里代表的是7*7的图像像素级别的分类概率

这代表原图32倍像素级别下采样的分类概率。

这个图片切片可能是原图片的一部分我们可以把相同类别的标定框进行合并。

4 滑动窗口存在窗口大小不确定移动间距不好确定的问题计算量大速度慢

5 改造的VGG网络会受限于32倍的下采样率

6定位-网络结构

定位输入的是一张图片通过网络输出的是标定框信息（位置）+分类结果

损失函数 total-loss = classification-loss + α regression-loss

α 可以使在送损失函数中的分类损失和回归损失中取得一定的平衡

提问：我们这个网络最后输出的feature map 包含空间信息吗？

答：包含神经网络在学习过程中是根据损失函数的中所需的信息来进行学习的，我们的total-loss 中包括空间的信息。

7我们使用的回归损失函数是平滑L1损失

这个损失函数在x=0时可导计算优越性

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分类&定位简述

分类1二分类：是猫？不是猫？多分类：是猫？是狗？是羊？2深度分类网络 = 特征提取层+分类器3softmax4损失函数就交叉熵损失5分类的两种结构：全连接：flatten操作卷积：squeeze操作（把维度为1的列去掉）卷积方式输入尺寸可不固定定位1定位的两种方式：滑动窗口改造的卷积神经网络2滑动窗口：我们通过不断的一个不断滑动的窗口来截取图片中...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。