sequence.pad_sequences() 是一个用于将输入序列标准化长度的函数,它属于 Python 机器学习库 Keras 中的序列处理工具。
该函数可以对一个列表中的多个序列进行填充,使得所有序列的长度都相同。它通常用于在将序列输入到神经网络之前将序列标准化到统一的长度,以便模型能够处理它们。
pad_sequences() 函数接受两个必需参数:
- sequences:要填充的序列,形式为一个整数列表的列表。
- maxlen:填充后序列的最大长度。
该函数还有一些可选参数,如 padding、truncating 和 value,可用于指定填充的方式(在序列的开头还是结尾填充),以及填充的值。
举个例子,假设我们有一个包含 3 个序列的列表,如下所示:
sequences =[[1, 2, 3], [4, 5, 6, 7], [8, 9]]
如果我们希望将所有序列填充为长度为 4 的序列,则可以使用以下代码:
from keras.preprocessing.sequence import pad_sequences
padded_sequences = pad_sequences(sequences, maxlen=4)
print(padded_sequences)
输出结果如下:
[[0 1 2 3]
[4 5 6 7]
[0 0 8 9]]
这里,第一个序列和第二个序列的长度已经达到了 4,