本文用gensim实践doc2vec,并与word2vec均值得到的词向量 在IMDB数据集情感分类任务中进行比较。
完整代码见 https://github.com/FlyingLittlePigJoy/word_embedding
由分析结果可知:在此情感分类数据集中(数据来源于参考博客),doc2vec对文档内容或情绪的表示效果还是很不错的。
参考博客:http://linanqiu.github.io/2015/10/07/word2vec-sentiment/
doc2vec paper: http://proceedings.mlr.press/v32/le14.pdf