论文题目: Bag of Tricks for Efficient Text Classification
作者:Armand Joulin (Facebook)
发表时间:EACL 2017
论文思想:融合基于深度学习和机器学习的文本分类模型,特点速度快,可以在CPU上运行。
Abstract
- 本文为文本分类任务提出了一种简单并且高效的基准模型——Fasttext。
- Fasttext模型在精度上和基于深度学习的分类器平分秋色,但是在训练和测试速度上Fasttext快几个数量级。
- 我们使用标准的多核CPU在10亿词的数据集上训练Fasttext,用时少于10分钟,并且在一分钟内分类好具有312K类别的50万个句子。
网络结构
该网络结构类似CBOW模型,输入的是词向量,经过隐藏层,获取句子向量,然后线性变换,获取分类。
# embedding层,获取词向量特征
# AvgPool1d 平均池化,获取句子特征
# 线性变换
class Fasttext