NLP解码

最新推荐文章于 2023-03-12 18:50:43 发布

火鸡哥

最新推荐文章于 2023-03-12 18:50:43 发布

阅读量417

点赞数

分类专栏：随记

本文链接：https://blog.csdn.net/u012587024/article/details/103166061

版权

随记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

# 从分词器中获取词索引数组(word,int)
word_index = tokenizer.word_index

# 将词索引键值颠倒(int word)
reverse_word_index = dict([(value,word) for (word,value) in word_index.items()])

# 将train_data的第一条数据解码
# 索引减去3,因为0､1､2是为“padding”（填充）、“start of sequence”（序列开始）、“unknown”（未知词）分别保留的索引
decoded_review = ' '.join([reverse_word_index.get(i-3,'?') for i in train_data[0]])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

火鸡哥

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NLP解码

# 从分词器中获取词索引数组(word,int)word_index = tokenizer.word_index# 将词索引键值颠倒(int word)reverse_word_index = dict([(value,word) for (word,value) in word_index.items()])# 将train_data的第一条数据解码# 索引减去3,因为0､1､2是为...
复制链接

扫一扫