机器翻译第一步--词向量的生成与保存

最新推荐文章于 2021-05-24 15:27:53 发布

LucyGill

最新推荐文章于 2021-05-24 15:27:53 发布

阅读量3.7k

点赞数

分类专栏： Python 文章标签： matlab word2vec python 斯坦福大学词向量

本文链接：https://blog.csdn.net/LucyGill/article/details/69666506

版权

Python 专栏收录该内容

41 篇文章 2 订阅

订阅专栏

最近在看斯坦福大学机器翻译的开源代码，琢磨着把代码稍微改动一下，做成中文到英文的翻译。机器翻译的第一步是将词转化成词向量。斯坦福大学没有做中文的转化，我只好自己想办法。

我用的是斯坦福大学的nmt-matlab-master代码，显然这是用matlab编写的。matlab中没有直接将词转换成词向量的程序可用，Python倒是有一个：word2vec。所以我就先用Python生成，存储为.mat类型的文件，再应用到matlab上。

下面是代码：

from gensim.models import word2vec  
import logging  
   
logging.basicConfig(format='%(asctime)s:%(levelname)s: %(message)s', level=logging.INFO)  
sentences =word2vec.Text8Corpus(u"F:\chinese1w.txt")
model =word2vec.Word2Vec(sentences, size=200)   
model.save(u"F:\分词.mat")

对，就是这么简单。

LucyGill

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器翻译第一步--词向量的生成与保存

最近在看斯坦福大学机器翻译的开源代码，琢磨着把代码稍微改动一下，做成中文到英文的翻译。机器翻译的第一步是将词转化成词向量。斯坦福大学没有做中文的转化，我只好自己想办法。我用的是斯坦福大学的nmt-matlab-master代码，显然这是用matlab编写的。matlab中没有直接将词转换成词向量的程序可用，Python倒是有一个：word2vec。所以我就先用Python生成，存储为.mat类
复制链接

扫一扫

专栏目录