这篇博客是一个教程,废话不多说,直接开始
1 语料的展示
因为我做的是dna数据所以这里和大家不一样。。。。。。。。。。。。。。。
2 下载官方代码
官方下载地址:GloVe(c语言版本)
3 修改文件
- 首先将源码上传到服务器
-
打开demo.sh
- 将前面的代码注释掉(如下图)
- 对应的将CORPUS修改为自己的语料名字,我的是words.txt (注意带上后缀)
- 到这里就大功告成了,接下来就是训练了。
- 输入 make
-
输入bash demo.sh
- 完事,vectors.txt就是我们要的词向量。
4 结果展示
这里可以看得出来结构和word2vec的还是很相似的,在第一行加上词的个数和维度就一样了。