textboxes 网络结构详解

1、SSD网络结构

image.png

Caffe代码 .prototxt中 :

SSD的结构为conv1_1,conv1_2,conv2_1,conv2_2,conv3_1,conv3_2,conv3_3,conv4_1,conv4_2,conv4_3,conv5_1,conv5_2,conv5_3(512),(注意这是:textbox++ 中 13 are inherited from VGG-16.)

fc6:3×3×1024的卷积(原来VGG16中的fc6是全连接层,这里变成卷积层,下面的fc7层同理),fc7:1×1×1024的卷积,conv6_1,conv6_2(对应上图的conv8_2),conv7_1,conv7_2,conv8_1,conv8_2,conv9_1,conv9_2,loss。
(注意:由于 fc6、fc7的原因 ,conv6_1到conv9_2 对应到上图的conv8_1 到conv11_2)

image.png

然后针对.prototxt中的 conv4_3(4),fc7(6),conv6_2(6 ),conv7_2(6),conv8_2(4),conv9_2(4)的每一个再分别采用两个3*3大小的卷积核进行卷积,这两个卷积核是并列的。
注意这也是:textbox++ 中6层 textbox layers.

2、textboxes 中 网络结构

image.png

这是一个28层的全卷积网络。额外的9个卷积层添加在VGG-16层之后(不是 1 中conv6_1到con9_1 共8个卷积层吗?),Text-box层连接着6个卷积层(同1中)。在每一个特征位置,一个text-box预测72维向量,这是文本出现的得分(text presencescores)(2维)和12个default box的偏移(4个offsets)。一个非最大抑制(NMS)用来聚合所有文本盒子(text-boxlayers)层的输出

2.1、关于12个default box

ssd的defaultbox

image.png

感谢:

ssd详解

textbox详解

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值