word2vec
文章平均质量分 82
码世界-
这个作者很懒,什么都没留下…
展开
-
使用预训练的word2vec词向量
以谷歌开源google news(bin)为例。下载地址:https://code.google.com/p/word2vec更多模型下载地址:https://github.com/xgli/word2vec-api之前被这个问题困扰了挺长时间,一直找不到有效的方法,可能是我太菜……在网上找资料也只找到了一种把bin转换成txt 文件的方式,但是效率出奇的低,无法想象,本地一运行程序就死机,服务器...原创 2017-12-02 16:22:52 · 25340 阅读 · 11 评论 -
使用glove词向量
在我的个人博客上很早就把这篇文章写出来了,现在转到CSDN,作为word2vec的姊妹篇,无论你使用的是word2vec还是glove,两种方式都是通用的。仅作少许改动即可。前段时间把word2vec词向量的用法整理了一下。处理的是二进制文件,二进制文件处理起来是比较快的,但是过程可能比较繁琐。这次整理了一下glove词向量的处理方式,文件是txt格式的。Glove.txt文件大概是这样子的。图中...原创 2018-04-14 10:11:46 · 9212 阅读 · 4 评论 -
【TEACH-NLP】词向量预处理-抽取词向量
词向量训练完成之后,并不能直接使用,还需要做进一步的处理——抽取词表中对应的词向量。并不是所有的词向量都是有用的,我们仅用到词表中的词向量,将抽取出来的词向量保存成一个新的文件,以备后续使用。【提要】一、这里我们要用到之前的两个文件:vocab.txt #词表vec.bin #词向量表二、还要生成一个新的文件来保存抽取出来的词向量:select_vocab.txt #抽取出...原创 2019-09-29 11:27:41 · 452 阅读 · 0 评论