FastText

fuchengguo666

已于 2022-03-03 22:06:52 修改

阅读量82

点赞数

分类专栏： text classification 文章标签： nlp

于 2020-10-11 11:38:33 首次发布

本文链接：https://blog.csdn.net/fuchengguo666/article/details/109003698

版权

2 篇文章 0 订阅

订阅专栏

fastText 方法包含三部分：模型架构、层次 Softmax 和 N-gram 特征。
FastText词向量与word2vec对比：
FastText= word2vec中 cbow + h-softmax的灵活使用
灵活体现在两个方面：
1）模型的输出层：word2vec的输出层，对应的是每一个term，计算某term的概率最大；而fasttext的输出层对应的是分类的label。不过不管输出层对应的是什么内容，起对应的vector都不会被保留和使用；
2）模型的输入层：word2vec的输出层，是 context window 内的term；而fasttext 对应的整个sentence的内容，包括term，也包括 n-gram的内容；
fasttext和word2vec两者本质的不同，体现在 h-softmax的使用。
Wordvec的目的是得到词向量，该词向量最终是在输入层得到，输出层对应的 h-softmax 也会生成一系列的向量，但最终都被抛弃，不会使用。
fasttext则充分利用了h-softmax的分类功能，遍历分类树的所有叶节点，找到概率最大的label（一个或者N个）