CS231n李飞飞计算机视觉迁移学习之物体定位与检测上

最新推荐文章于 2024-03-12 10:14:02 发布

「已注销」

最新推荐文章于 2024-03-12 10:14:02 发布

阅读量478

点赞数

分类专栏： CS231n

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangchy29/article/details/86795696

版权

这篇博客介绍了物体定位与检测的两种方法，包括当做回归问题求解和使用滑动窗口。对于回归问题，网络会预测边界框的四个参数。滑动窗口方法通过在不同位置应用网络来检测对象，而高效的实现是在全连接层前使用卷积层。

摘要由CSDN通过智能技术生成

迁移学习之物体定位与检测上

分类和定位

分类：给定一个图像，输入图像包含的对象的类别。

定位：给定一个图像，找到图像中对象所在的区域，即找出边界框。

数据集：一千个类别，每个类别有800张图像。

网络结构如上图，定位和分类可以同时训练也可以分别训练。

方法一：当做回归问题求解

分类是一个回归问题，可以将定位也当成回归问题，定位及找到对象所在边界框，边界框为方形，所以确定边界框的左上角的坐标以及长和宽四个参数即可。所以也可以将定位看成是给定一个图像，找出这四个参数的回归问题。

如上图所示，在一个卷积网络之后分别连接两个全连接层，一个用于分类，一个用于定位。

两种回归，一种是无论图像是什么类别，定位部分的网络都有相同的结构和参数来得到边界，这种叫不定类回归。另一种为定类回归，即输出是C乘四个边界参数，即每一类别都有一种边界框。

在哪个位置进行回归？两种方法，第一种在最后一个卷积层后面加上回归网络，如VGG、OverFeat。第二种在全连接层之后。

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。