tf.keras.preprocessing.text.Tokenizer(）作用和简单使用 Tokenizer

Alocus_

已于 2022-03-20 17:23:37 修改

阅读量3.2k

点赞数 2

分类专栏：深度学习文章标签：自然语言处理 python tensorflow

于 2021-05-17 16:46:34 首次发布

本文链接：https://blog.csdn.net/Crystal_remember/article/details/116938863

版权

深度学习专栏收录该内容

16 篇文章

订阅专栏

作用：将文本向量化，或将文本转换为序列（即单个字词以及对应下标构成的列表，从1开始）的类。用来对文本进行分词预处理。

示例

import tensorflow as tf
#Tokenizer 的示例
tokenizer = tf.keras.preprocessing.text.Tokenizer(
      filters='')
text = ["昨天 天气 是 多云", "我 今天 做 了 什么 呢"]
tokenizer.fit_on_texts(text)
tensorr = tokenizer.texts_to_sequences(text)
print(tensorr)

输出