Tensorflow2.0之 tf.keras.layers.Conv1D 做自然语言处理

tf.keras.layers.Conv1D(
    filters, kernel_size, strides=1, padding='valid', data_format='channels_last',
    dilation_rate=1, activation=None, use_bias=True,
    kernel_initializer='glorot_uniform', bias_initializer='zeros',
    kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None,
    kernel_constraint=None, bias_constraint=None, **kwargs
)

这是Tensorflow的API文档给的参数例子,参数的含义上面也有写,但参数太多,并且我感觉说的不是很明白,所以我自己写了一个例子,给大家讲解一下它的主要参数的含义以及输入格式(如有错误望请指正)。

input_shape = (15, 7, 4)
x = tf.random.normal(input_shape)
y = tf.keras.layers.Conv1D(64, 4,strides=2, activation='relu', padding="same",input_shape=input_shape)(x)
print('y的数据形式:',y.shape)

在这里插入图片描述
首先我们要知道,Conv1D是一维卷积,主要用来处理自然语言处理方面的信息输入。
input_shape:其输入的维度是三维的tensor,(batch,seq_len,dim)的格式。batch:你要输入的文本数量。seq_len:一个文档中文字的数量(每个文档的度是一样的,而我们的文档的长度大部分是不一样的,所以我们要先对文档做预处理,进行填充使得它们的长度一致)。dim:把我们的第二个维度中的词做成向量的维度。(这个一般会用到Word2Vec).例如:(4,22,6) 有四个文档,每个文档有22个单词,每个单词映射到六维表示。

filters:过滤器(卷积核)的数目

kernel_size:卷积核的大小,卷积核本身应该是二维的,这里只需要指定一维,因为第二个维度即长度与词向量的长度一致,卷积核只能从上往下走,不能从左往右走,即只能按照文本中词的顺序,也是列的顺序。

strides : 每次卷积的步长,如果不指定的话,默认是1.

padding:防止处于最外面的数据不能被充分学习到。

上面的例子上输入是 : 过滤器是64个,卷积核大小是4,步长是2, 输入是一个三维数据。
最有我们输出卷积后的数据格式是:(15, 4, 64)

那这个形式是怎么得到的呢?
15: 15 是我们输入的文档数量,这个不论怎么卷积也不会改变的。
4: 4是我们进行一次卷积操作后得到的。因为卷积核是4,所以每次卷积选四列,每次移动两列,padding方式是’same’ 所以卷积后剩下的列数是:(seq_len - kernel_size)+2padding/strides+1 = 4(向下取整) padding = 1
64: 64是我们过滤器的数量,有多少个过滤器你的第三个维度就是多少。

  • 8
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

辰溪0502

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值