tensorflow实现word2vec报错&解决集

最新推荐文章于 2022-07-06 15:59:26 发布

小茶子

最新推荐文章于 2022-07-06 15:59:26 发布

阅读量924

点赞数

分类专栏：深度学习自然语言处理 PYTHON

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/younger821/article/details/104577058

版权

先是从书上学习，然后利用随书代码实现word2vec，代码在此：https://github.com/PacktPublishing/Natural-Language-Processing-with-TensorFlow/blob/master/ch3/ch3_word2vec.ipynb

因为想做领域词的识别，故没有用已有的英文数据试验，用的自己找的专业领域的小段语料做实验，先用jieba分词，然后开始Word2vec，这篇就写写报的错以及解决，有时间再详解代码。

1、在Generating Batches of Data for Skip-Gram阶段，报错：

print(' batch:', [reverse_dictionary[bi] for bi in batch])
KeyError: 326960996

原因是：batch一开始是通过np.ndarray随机初始化的任意数值数组，当2倍window_size的大小没有被batch_size整除时，batch里剩下的值（如上面报错的326960996）作为reverse_dictionary的索引必然报错。举个例子如下，一切了然：

# data=[44,45,46,47,48,49,0,0,0,5,0,0,0

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
4
评论
tensorflow实现word2vec报错&解决集

先是从书上学习，然后利用随书代码实现word2vec，代码在此：https://github.com/PacktPublishing/Natural-Language-Processing-with-TensorFlow/blob/master/ch3/ch3_word2vec.ipynb因为想做领域词的识别，故没有用已有的英文数据试验，用的自己找的专业领域的小段语料做实验，先用jieba分词...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。