NLP
Gavin Chan
在读研究生一枚
展开
-
word2vec训练维基百科中文词向量
一、环境:win10+anaconda3+TensorFlow1.10二、数据:下载中文维基百科语料数据:wiki_data_1.4g三、word2vec步骤:1. 将xml的wiki数据转换成text数据先将zhwiki-latest-pages-articles.xml.bz2文件复制到process.py所在目录下,cmd进入process.py文件所在目录,执行如下命令:pyt...原创 2018-11-10 20:03:37 · 1491 阅读 · 0 评论 -
Window下使用fastText
近期学习NLP时使用fastText发现Windows下fastText使用会出问题,研究一番后发现可以使用,但和linus下有所区别,整理如下,希望可以帮到需要的人。1. 环境win10+anaconda2. 数据__label__greet howdy__label__greet hey there__label__greet hello__label__greet hi__l...原创 2018-12-16 19:06:32 · 1342 阅读 · 7 评论