FastText:快速的文本分类器
文本分类需要CNN?No!fastText完美解决你的需求(后篇)
fastText可以解决不平衡分类问题,因为在对某个节点进行计算时,完全不依赖于它的上一层的叶子节点
FastText 优缺点
- 高效的训练速度、适合大型数据
- 支持多语言表达,英、法、西、德、捷克,同时FastText的性能要比Word2Vec的效果好很多,也别一些其他的动态的词态词汇表征要好
- 专注于文本分类,很多的标准问题上实现当下最好的表现比如标签预测、文本倾向……
FastText 原理(模型架构、层次softmax、N-gram表征)
FastText输入一段文本序列,输出属于各个类别的概率