python自定义函数实例 lite_如何在TensorFlow ObjectDetection API中使用自定义输入分辨率设置特定的SSD(lite)预测架构...

我想用TensorFlow ObjectDetection API在COCO数据集上训练一个自定义SSDLite-MobileNetV2对象检测器。我希望有更高的输入分辨率,而不是固定的(300300)输入分辨率,例如VGA(640480)或(544544)。

因为架构是完全卷积的,所以有可能有不同的输入分辨率。

不过,我想通过以下方式稍微改变一下SSD架构:

使用原始输入分辨率300x300,在第一个3x3 conv和5个反向瓶颈之后,我们有一个19x19x96的特征图,在另外两个瓶颈之后是10x10x320,然后是1x1-10x10280,然后使用3x3深度方向的可分离卷积变成5x5x512、3x3x256、2x2x256和1x1x1x128。

然后在扩展版本的19x19-19x19x576、10x1028和所有其他分辨率较低(5x5、3x3、2x2、1x1)的特征地图上进行预测。在

如果输入分辨率为554x554,则如下所示:

在3x3 conv和5个反向瓶颈之后,它是34x34x96,在另外两个17x17x320之后,但是为了达到1x1分辨率,我需要一个额外的层:

9x9、5x5、3x3、2x2,然后是1x1。在

我想修改架构的方法是跳过2x2分辨率,通过一个未添加的3x3深度方向的可分离卷积从3x3直接到1x1。我的问题是,使用TensorFlow ObjectDetection API时,是否可以不进行大量代码修改,例如通过更改configuration file或稍微修改代码。在

编辑:添加了Python标记。在

编辑2-尽量把问题弄清楚:

在当前具有当前填充的架构中,为了从3x3到1x1的特征映射,我需要通过2x2的特征映射(3x3 conv,stride=2,padded)。我想知道是否有可能改变配置,以实现直接从3x3到1x1功能图与一个3x3转换,如果不能-如何编辑/制作替代ssd_mobilenet v2_feature_提取器(或其他代码)来实现这一点。在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值