【论文阅读】Bag of Tricks for Efficient Text Classification

最新推荐文章于 2023-11-20 11:58:24 发布

沐兮Krystal

最新推荐文章于 2023-11-20 11:58:24 发布

阅读量288

点赞数

分类专栏： NLP 文章标签：论文阅读机器学习深度学习

本文链接：https://blog.csdn.net/GW_Krystal/article/details/126864768

版权

27 篇文章 16 订阅

订阅专栏

摘要

线性分类器在特征之间与类别之间不能共享参数。这可能会限制他们的泛化能力在大输出空间的背景下，当一些类别只有很少的例子时。一般的解决方法时分解这些线性分类器到一些低等级的矩阵或者使用多层神经网络。
Figure1展示了一个简单的有等级约束的线性模型。第一个权重矩阵A时对单词的一个搜索表。将词表示平均后得到文章的表示，在反过来馈入一个线性分类器。文本表示是一个隐藏层的变量，它很可能会被重新使用。本文使用softmax函数来计算预定义类别的概率分布。对于一个集合的 $N$ 个文档，这会导致最小化各个类别的负对数似然：
$-\frac{1}{N}\sum_{n=1}^{N}y_nlog(f(BAx_n))$
式子中的 $x_n$ 是第 $n$ 个文档的标准化的bag特征， $y_n$ 是标签， $A$ 和 $B$ 是权重矩阵。这个模型在多CPU上进行异步的训练，使用随机梯度下降和一个线性衰退的学习率。

当类别的数量很多时，使用线性分类器的计算成本太高。更精确的说，计算的复杂度为 $O (kh)$ ， $k$ 时类别的数量， $h$ 时文本表示的维度。为了提升我们的运行时间，本文使用了一个基于哈夫曼编码树的层级softmax。

关注

专栏目录