源码解读
对感兴趣的模型、算法、框架的源码解读
QvQ是惊喜不是哭泣
不羁而自律
展开
-
(1.2)GloVe源码解析——vocab_count.c
概览vocab_count.c的功能就是生成词典。它的输入是整个语料,它的输出是词典。词典的形式是单词以及单词在语料中出现的次数(如下表)。//vocab.txtthe 1061396of 593677and 14567词典是按照频数从高到低排好序的。这部分代码和word2vec中建立词典的代码很像。由于C语言中没有dict这个的现成的数据结构,需要用C语言自己写一个dict。首先...原创 2018-10-20 20:04:16 · 1083 阅读 · 0 评论 -
(1.1)GloVe源码解析
安装在github上找到源码下载编译即可$ git clone http://github.com/stanfordnlp/glove$ cd glove && make$ ./demo.sh执行顺序GloVe代码包括了四个.c文件首先执行vocab_count.c这个文件的功能是扫一遍语料,建立一个字典。执行cooccur.c文件。它的功能是从语料中建立共现矩...原创 2018-10-20 20:19:36 · 1560 阅读 · 0 评论