tf.keras.utils.pad_sequences()

作用:

使长度标准化

此函数将序列(lists of integers)的列表(of length num_samples)转换为形状为(num_samplesnum_timesteps)的 2D Numpy 数组。 num_timesteps是 maxlen 参数(如果提供),或者是列表中最长序列的长度。

短于 num_timesteps 的序列用值填充,直到它们长 num_timesteps

长于 num_timesteps 的序列将被截断,以使其符合所需的长度。

发生填充或截断的位置分别由参数填充和截断决定。 从序列的开头预填充或删除值是默认设置。

参数

tf.keras.utils.pad_sequences(
    sequences,                      # 序列长度
    maxlen=None,                    # 可选 Int,所有序列的最大长度。 如果未提供,序列将被填充到最长的单个序列的长度。
    dtype='int32',                  # 可选,默认为“int32”。 输出序列的类型。 要使用可变长度字符串填充序列,可以使用 object.
    padding='pre',                  # 字符串,“pre”或“post”(可选,默认为“pre”):在每个序列之前或之后填充。
    truncating='pre',               # 字符串,“pre”或“post”(可选,默认为“pre”):从大于 maxlen 的序列中删除值,无论是在序列的开头还是结尾。
    value=0.0                       # 浮点数或字符串,填充值。 (可选,默认为 0。)
)

返回值

Numpy array with shape (len(sequences), maxlen)

例子

import tensorflow as tf                   # 导入tensorflow
sequence = [[1], [2, 3], [4, 5, 6]]       # 输入序列
tf.keras.preprocessing.sequence.pad_sequences(sequence)      # 长度标准化
array([[0, 0, 1],
       [0, 2, 3],
      [4, 5, 6]])
import tensorflow as tf    # 导入tensorflow
sequence = [[1], [2, 3], [4, 5, 6]]    # 输入序列
tf.keras.preprocessing.sequence.pad_sequences(sequence, padding='post')   # 长度标准化
array([[1, 0, 0],
       [2, 3, 0],
       [4, 5, 6]])

 主要参考:tf.keras.utils.pad_sequences  |  TensorFlow Core v2.9.1 (google.cn)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值