参考文章:SSD关键源码解析-知乎 目标检测|SSD原理与实现
真是佩服那些能从头到尾把算法实现好的人。。该有多难啊。
现阶段成果:成功运行单种类目标检测
1.遇到最多的问题就是 list, array, tensor互相转换了。大部分时间消耗在这个上面。
解决:tensor --> array:
a: tensor; b: array
with tf.Session() as sess:
b = sess.run(a)
list --> array:
a: list; b: array
b = np.array(a, dtype = 'float32')
2.实际VGG输出layer的shape与论文里的不相同。
论文里的layer的shape为(38, 38),(19, 19),(10, 10),(5, 5),(3, 3),(1, 1)。但是按照VGG论文的VGG-16来,输入300*300*3的时候,输出的shape有时候与要求的不一样。后来看了别人的文章,发现是padding的问题。