Corpus zh_cn 搜狗语料库:ftp://ftp.labs.sogou.com/Data/SogouCS/SogouCS.tar.gz 中文维基百科语料库:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 en 英文维基百科语料库:https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2(历史版本) 参考文献 中英文维基百科语料上的Word2Vec实验 利用中文数据跑Google开源项目word2vec - hebin