tf.keras.layers.TextVectorization 示例

将文本要素映射到整数序列的预处理图层。

将不同长度的文本,转换成相同长度的数组

import tensorflow as tf
text_layer = tf.keras.layers.TextVectorization(
    max_tokens=5000,  # 词汇表最大尺寸
    output_mode='int',  # 输出整数索引
)  # 创建 TextVectorization 层
print(text_layer)
<keras.layers.preprocessing.text_vectorization.TextVectorization object at 0x000001E6C7EE61C0>
data = [
    "听 话",  # 第1句话
    "你 好 吗 ?",  # 第2句话
    "我 是 一 个 中 国 人"  # 第3句话
]  # 数据
text_layer.adapt(data)  # 数据加入 TextVectorization 层 
text_layer.get_vocabulary()  # 得到所有单词字典(字典里多了 '' '[UNK]')
['', '[UNK]', '?', '话', '是', '我', '好', '国', '听', '吗', '你', '人', '中', '个', '一']
text_layer(data)  # 得到 data 中字典下标组成的数组
<tf.Tensor: shape=(3, 7), dtype=int64, numpy=
array([[ 8,  3,  0,  0,  0,  0,  0],
       [10,  6,  9,  2,  0,  0,  0],
       [ 5,  4, 14, 13, 12,  7, 11]], dtype=int64)>

在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

夏华东的博客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值