Preprocessing
Sequence Preprocessing
TimeseriesGenerator——批量生成时序数据
pad_sequences—— 将多个序列截断或补齐为相同长度
skipgrams—— 生成 skipgram 词对
make_sampling_table—— 生成一个基于单词的概率采样表
Text Preprocessing
Tokenizer—— 文本标记实用类
hashing_trick—— 将文本转换为固定大小散列空间中的索引序列
one_hot—— 将文本编码为大小为 n 的单词索引列表
text_to_word_sequence——将文本转换为单词(或标记)的序列
Image Preprocessing
ImageDataGenerator class—— 通过实时数据增强生成张量图像数据批次
apply_transform—— 根据给定的参数将变换应用于图像
fit—— 将数据生成器用于某些示例数据
flow—— 采集数据和标签数组,生成批量增强数据
flow_from_dataframe—— 输入 dataframe 和目录的路径,并生成批量的增强/标准化的数据
flow_from_directory
get_random_transform—— 为转换生成随机参数
random_transform—— 将随机变换应用于图像
standardize—— 将标准化配置应用于一批输入