NLP10-SGM-论文学习笔记

最新推荐文章于 2023-07-20 15:36:05 发布

小杰.

最新推荐文章于 2023-07-20 15:36:05 发布

阅读量919

点赞数 1

分类专栏：论文阅读总结 NLP

本文链接：https://blog.csdn.net/weixin_44285710/article/details/108283210

版权

14 篇文章 3 订阅

订阅专栏

10 篇文章 2 订阅

订阅专栏

论文题目：SGM: Sequence Generation Model for Multi-Label Classification

发表期刊：2018-Coling Bestpaper

多标签分类：The target of the MLC task is to assign multiple labels to each instance in the dataset

将多标签分类问题看做是一个链式的二分类问题

也采用了序列生成的方式，但没有采用注意力机制，获得的提升有限，原因值得思考

Encoder采用双向LSTM，Decoder采用LSTM，结合了注意力机制，采用序列生成的方式预测多个标签
标签处理：根据出现频率对标签进行排序，高频的标签放在前面【出现次数多的为大类的概率更大】
mask softmax：预测过的标签不再重复预测
global embedding：将所有标签信息的embedding融合得到全局的embedding
Decoder【LSTM】接收上一时刻(t-1)decoder的隐藏状态S(t-1)、上下文向量 Ci 和 GE 作为输入，产生时刻t的隐藏状态，最后通过softmax层达到标签的预测。
文本序列Xi是一句话中的m个词通过词嵌入的方式获得的词向量