SSD物体检测论文:arXiv1512.02325
SSD作为较新出现的物体检测算法,拥有网络搭建简单、无需细节调参的优秀特点。其不仅用于物体检测,还可应用于文字检测任务。近期实现的TextBox(arXiv1611.06779)文字检测借鉴了SSD的default boxes。虽然算法不难理解,但是实现过程中遇到了不少问题。通过学习借鉴他人代码以及自己总结,特在此记录生成默认框部分的方法与思路。
任务描述:
给定原图宽高像素和特征图宽高,以及一系列默认框宽高比,生成对应的默认框列表
如特征图为4x4大小,图片大致应划成4x4的网格形状,对于每一个网格中心都有一组不同宽高比的矩形框。
运行效果:
左图为生成的4x4网格 右图为一个网格应具备的不同比例的默认框
(方便起见默认框宽高较小,实际算法默认框大小比上图大一倍左右)
实现思路:
1. 数据的表示:之前我很少事先考虑数据在算法中如何表示。对于默认框问题,最先在脑海中浮现的可能是使用原图的尺寸进行计算。事实上,若将原图映射在0到1的范围内,数据的表示会更加清晰。尤其是当图像经过了一定程度的缩放之后