堆叠一维卷积来做唤醒

前言

一维卷积在语音和自然语言处理中十分常见,本篇paper:Stacked 1D convolutional networks for end-to-end small footprint voice trigger detection通过一个特征上的一维卷积和时间维度上的一维卷积来完成特征堆叠的。

论文

在这里插入图片描述
block结构如上图所示,其中现在特征维度上做一维卷积,然后在时间维度上做一维卷积,其中在时间维度上可以根据卷积核大小控制帧长。
本片论文的block实现也十分简单,正如论文中所说:
在这里插入图片描述
相当于一个2D卷积用了一个F1和一个1K的卷积核。

代码实现

import tensorflow as tf 



input=39#MFCC特征维数

x = tf.placeholder(tf.float32, [None, None, 39, 1])#输入数据
print(x)
conv1=tf.layers.conv2d(x,1,[3,1],strides=1, padding='same')#第一层一维卷积
print(conv1)
conv2=tf.layers.conv2d(conv1,1,[1,3],strides=1, padding='same')#第二层TDNN
print(conv2)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值