目标检测——RCNN之建议框padding

最新推荐文章于 2024-07-08 15:56:38 发布

竹_猗

最新推荐文章于 2024-07-08 15:56:38 发布

阅读量3.1k

点赞数 3

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangzhihao_2015/article/details/106437901

版权

博客详细介绍了在RCNN目标检测过程中，如何进行建议框的context padding，澄清了原论文中关于resize图片的疑惑。作者通过研究`rcnn_create_model.m`, `rcnn_extract_regions.m`, `rcnn_im_crop.m`三个文件，发现padding并非简单的等距扩大16像素，而是基于图像长宽比进行，以保持形状不变。同时提到了各向同性和各向异性变形的概念，并推荐了一篇相关文章进行深入理解。" 136089646,8269512,前后端交互实现分页功能设计解析,"['前端开发', '后端开发', '数据库']

摘要由CSDN通过智能技术生成

在学习RCNN的过程中，一直搞不明白resize 227*227这个步骤之前的context padding（建议框padding）这个步骤是怎么进行的，因为发现原论文中最后得到的resize图片（下图 a中红框）跟我所理解得到的resize图片不太相符，

图 a

我所理解的padding后的图片，应该是上下左右都等距地扩大16个像素值，但是从图a中红框可以看出原文并没有进行等距地扩大16个像素，所以百思不得其解，在google各种问题，查看各种网址，最终在源代码中找到了答案，分别查看：

1. rcnn_create_model.m

2.rcnn_extract_regions.m

3.rcnn_im_crop.m

这3个文件发现：虽然文中说是padding 16个像素值，但是却是在保持长宽比的基础上进行padding，也就是说如果一幅影像的长宽比不是1:1的话，那么建议框的扩大也不是按照1:1进行。

对于文中出现的各向同性变形以及各向异性变形，可以参考这篇文章：

https://www.jianshu.com/p/3a0a0e5a26a1

终于可以睡觉了～各位早安，晚安～

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

竹_猗 CSDN认证博客专家 CSDN认证企业博客

码龄9年

37: 原创

11万+: 周排名

34万+: 总排名

5万+: 访问

: 等级

702: 积分

11: 粉丝

32: 获赞

19: 评论

95: 收藏

私信

关注

热门文章

分类专栏

terrain analysis 1篇
QGIS 1篇
数据处理 1篇
脚本运行 2篇
错误 4篇
总结 3篇
机器学习 2篇
R语言 6篇
深度学习 7篇
云服务器 4篇
python 22篇
deep learning笔记 3篇
函数 8篇
SAGA GIS 2篇

最新评论

人工神经网络B-P反向传播网络算法的实现 R语言
蔚蓝50米: 您好，请问这里的B1和B2也是隐藏层的一部分吗
目标检测——RCNN之建议框padding
竹_猗: 你好，我觉得应该不是的，你可以查看https://www.jianshu.com/p/3a0a0e5a26a1这篇文章，我觉得红框部分应该是属于各向同性的b情况
目标检测——RCNN之建议框padding
Andy in boots: 博主你好，请问是根据长宽比例，乘16作为padding吗？
Visualizing convnet filters——K$gradients()报错（笔记）
qq_52776812: 人傻了， k_gradients用不了后，加了 tensorflow:::tf$compat$v1$disable_eager_execution()，k_mean也用不了 tensorflow:::tf$compat$v1$enable_eager_execution()运行不了干脆清理一下环境， mean和gradients都能运行了这是什么意思？我不明白
Visualizing convnet filters——K$gradients()报错（笔记）
qq_52776812: 请问博主，用了这个方法后，报错TypeError: Cannot convert a symbolic Keras input/output to a numpy array. This error may indicate that you're trying to pass a symbolic value to a NumPy call, which is not supported. Or, you may be trying to pass Keras symbolic inputs/outputs to a TF API that does not register dispatching, preventing Keras from automatically converting the API call to a lambda layer in the Functional Model.怎么办？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。