NLP 利器 Gensim 库的使用之 Word2Vec 模型案例演示（基于 word2vec-google-news-300 预训练模型，附下载）

最新推荐文章于 2025-03-12 16:56:05 发布

AItrust

最新推荐文章于 2025-03-12 16:56:05 发布

阅读量1.5w

点赞数 11

分类专栏： NLP 文章标签：机器学习深度学习人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42067550/article/details/106444334

版权

Gensim 库的使用之 Word2Vec 模型案例演示

要见识一下 Word2Vec 模型可以做什么，那么最好的方法就是直接下载一个预训练模型，然后尝试用一下看看效果。

我们在这里获取一个在 Google News 数据集上训练完成的 Word2Vec 模型，覆盖了大约 300 万的词汇和短语。

这样一个模型需要几个小时来进行训练，但是既然 Google 已经将其公开，那直接花几分钟下载下来就能用了。

！！！注意：该模型大小约 2GB，而且需要科学的方法才能下载！实在无法解决网络问题的朋友，可以用我提供的本站连接下载，然后解压到对应位置！！！

目录：

模型下载地址：
一、下载预训练模型 word2vec-google-news-300
二、查看词表情况
三、非常用词的限制
四、词语相似度

模型下载地址：

～～由于文件太大，分了10个部分～～
word2vec-google-news-300.zip.001
word2vec-google-news-300.zip.002
word2vec-google-news-300.zip.003
word2vec-google-news-300.zip.004
word2vec-google-news-300.zip.005
word2vec-google-news-300.zip.006
word2vec-google-news-300.zip.007
word2vec-google-news-300.zip.008
word2vec-google-news-300.zip.009
word2vec-google-news-300.zip.010

不想在本地运行的朋友，也可以选择在线尝试该模型的效果：

http://radimrehurek.com/2014/02/word2vec-tutorial/#app

不过，如果不是科学的连接方式，不确保可以登陆该网页～～

该模型是利用了整个 Google News 大约 1000 亿个词的语料训练而成！

一、下载预训练模型 word2vec-google-news-300

import gensim.downloader as api
wv = api.load

最低0.47元/天解锁文章

评论 15

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。