tensorflow里的深度可分离卷积的实现API. 也即是MobileNet V1和V2里提到的depthwise conv + pointwise conv. 函数接口:
@tf_export('layers.separable_conv2d')
def separable_conv2d(inputs,
filters,
kernel_size,
strides=(1, 1),
padding='valid',
data_format='channels_last',
dilation_rate=(1, 1),
depth_multiplier=1,
activation=None,
use_bias=True,
depthwise_initializer=None,
pointwise_initializer=None,
bias_initializer=init_ops.zeros_initializer(),
depthwise_regularizer=None,
pointwise_regularizer=None,
bias_regularizer=None,
activity_regularizer=None,
depthwise_constraint=None,
pointwise_constraint=None,
bias_constraint=None,
trainable=True,
name=None,
reuse=None):
filters
和平常的conv2d参数一样,即最后得到的输出channel数. 这个函数做了两步操作(个人理解,不知道究竟对不对):
- 首先使用大小为
kernel_size
大的卷积核做depthwise
操作, 卷积核的初始化方式依赖于传递的参数depthwise_initializer
- 接着使用
1x1
大小的卷积核做pointwise conv
, 卷积核的初始化方式依赖于传递的参数pointwise_initializer
. - 假设函数
inputs
输入通道数为M
,则第一步中,一共有M
个kernel_size X kernel_szie X 1
大小的卷积核, 每个卷积核都只和一个channel做二维上的卷积运算, 最终得到M
个 F o u t F_{out} Fout x F o u t F_{out} Fout x 1 大小的输出结果. F o u t F_{out} Fout是卷积后的featuremap
大小. - 接着, 使用大小为
1x1xM
的卷积核做pointwise conv
, 总共有filters
个, 每个卷积核都和第一步得到的M个featuremap
结果做卷积运算,最后得到 F o u t F_{out} F