- 安装gensim:pip install gensim
- 准备预料:word2vec中需要sens是经过预处理且用空格进行分词的
- 训练模型
w2v_model = gensim.models.Word2Vec(sentences, min_count=5, size=128, window=5)
size:词向量的维度,默认值是100。这个维度的取值一般与我们的语料的大小相关,如果是不大的语料,比如小于100M的文本语料,则使用默认值一般就可以了。如
w2v_model = gensim.models.Word2Vec(sentences, min_count=5, size=128, window=5)
size:词向量的维度,默认值是100。这个维度的取值一般与我们的语料的大小相关,如果是不大的语料,比如小于100M的文本语料,则使用默认值一般就可以了。如