tf.keras.preprocessing.sequence.pad_sequences 截断填充序列

tf.keras.preprocessing.sequence.pad_sequences 截断填充序列

import tensorflow as tf
import numpy as np

pad_sequences(sequences, maxlen=None, dtype='int32', padding='pre', truncating='pre', value=0.0) pads sequences to the same length. 截断填充,多个数组序列统一到同一长度,默认是前面截断或填充。

array_1 = list(np.random.randint(100, size=10))
array_2 = list(np.random.randint(100, size=8))
array_3 = list(np.random.randint(100, size=15))
seq = [array_1, array_2, array_3]
print('\n'.join(map(str, seq)))
[45, 42, 11, 24, 54, 78, 24, 71, 45, 71]
[60, 65, 17, 72, 46, 51, 88, 24]
[53, 56, 7, 47, 67, 14, 2, 28, 89, 5, 58, 43, 59, 26, 25]

下面的例子,后面填充,统一长度为9,默认前面截断。可以看到,第1、3个序列超过9个元素,前面部分被截断,第2个序列不足9个,后面填充0。

tf.keras.preprocessing.sequence.pad_sequences(seq, maxlen=9, padding='post', value=0)
array([[42, 11, 24, 54, 78, 24, 71, 45, 71],
       [60, 65, 17, 72, 46, 51, 88, 24,  0],
       [ 2, 28, 89,  5, 58, 43, 59, 26, 25]], dtype=int32)

下面的例子,后面填充,后面截断,统一长度为9。可以看到,第1、3个序列超过9个元素,后面部分被截断,第2个序列不足9个,后面填充0。

tf.keras.preprocessing.sequence.pad_sequences(seq, maxlen=9, padding='post', truncating='post', value=0)
array([[45, 42, 11, 24, 54, 78, 24, 71, 45],
       [60, 65, 17, 72, 46, 51, 88, 24,  0],
       [53, 56,  7, 47, 67, 14,  2, 28, 89]], dtype=int32)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值