- 博客(2)
- 资源 (4)
- 收藏
- 关注
原创 (1.1)GloVe源码解析
安装在github上找到源码下载编译即可$ git clone http://github.com/stanfordnlp/glove$ cd glove && make$ ./demo.sh执行顺序GloVe代码包括了四个.c文件首先执行vocab_count.c这个文件的功能是扫一遍语料,建立一个字典。执行cooccur.c文件。它的功能是从语料中建立共现矩...
2018-10-20 20:19:36 1541
原创 (1.2)GloVe源码解析——vocab_count.c
概览vocab_count.c的功能就是生成词典。它的输入是整个语料,它的输出是词典。词典的形式是单词以及单词在语料中出现的次数(如下表)。//vocab.txtthe 1061396of 593677and 14567词典是按照频数从高到低排好序的。这部分代码和word2vec中建立词典的代码很像。由于C语言中没有dict这个的现成的数据结构,需要用C语言自己写一个dict。首先...
2018-10-20 20:04:16 1075
中文垃圾短信数据集NLP
2018-07-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人