物体定位Localization

最新推荐文章于 2024-03-30 15:18:31 发布

ForABiggerWorld

最新推荐文章于 2024-03-30 15:18:31 发布

阅读量576

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zjucor/article/details/78057229

版权

deep learning 专栏收录该内容

92 篇文章 1 订阅

订阅专栏

于分类的区别在于定位还需要输出bonding box，

可以就简单的增加一个regression header来训练输出bonding box部分

可以把regression header放在左后一个conv层后面，也可以放在feature layer

有时候找到多个物体（个数是固定的，比如定位人脸，手的位置）的bonding box，只需要输出多个参数就好了

上面说的方法比较直观，另外的idea是把定位转化为分类

用不同的sliding window来截取很多图片，对这些图片进行分类，得到是某一个类的概率，最后用这些概率对所有的bonding box就行merge（Herustic）

但是这种方法计算量很大，一种化简的思路是把FC转化为Conv，这样对输入图片的大小就没有限制了，然后我们就可以吧大图片feed into net，output更大了，结果看起来就是把很多个的图片同时通过网络，但是我们只需要计算一次

这其中的原因在于在Conv计算的额时候，很多区域是重叠的

ForABiggerWorld

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ForABiggerWorld CSDN认证博客专家 CSDN认证企业博客

码龄9年

894: 原创

3万+: 周排名

206万+: 总排名

73万+: 访问

: 等级

1万+: 积分

73: 粉丝

159: 获赞

43: 评论

233: 收藏

私信

关注

热门文章

分类专栏

最新评论

关于opencv不能读取GIF图片
讯飞摸鱼躺平王: 直接用VideoCapture来读不就行了，我的咋没license问题？
关于Pytorch的parameters()里面，BN layer没有running_mean和running_var
where_r_u: 但保存训好的model时会保存running_mean和running_var吗
opencv 中Mat的一些操作
中世纪游吟诗人: 太感谢了，关于opencv for android网上的资料真的太少了，真的很重要
关于F1 loss
sixpackabs: 你好，请问您的这个正确的解法中的predict和target都是单个batch吗？？
关于F1 loss
meis_sdh: 麻烦请问代码中predict = torch.clamp(predict * (1-target), min=0.01) + predict * target这句作用是干什么的？我试了一下这句无论加不加，最终的结果都一样

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。