HFT-CNN: Learning Hierarchical Category Structure for Multi-label Short Text Categorization
1、背景
1、作者(第一作者和通讯作者)
Kazuya Shimura
2、单位
University of Yamanashi
3、年份
2018
4、来源
计算语言学协会
2、四个问题
1、要解决什么问题?
类别层次结构(HS),该方法利用类别之间的层次关系来解决数据稀疏问题。HS层次越低,分类性能越差。因为较低的类别是细粒度的,每个类别的训练数据量比较高级别的要小得多。解决HS低层次的分类问题。
2、用了什么方法解决?
通过应用卷积神经网络(CNN)和微调技术
3、效果如何?
在两个基准数据集上的实验结果表明,本文提出的方法与CNN方法相比具有较强的竞争力。
4、还存在什么问题?
论文笔记
1、INTRODUCTION
长文本由于自身的特点和信息量,一段文本会描述一个特定的主题。短文本由于其自身长度的原因是缺少这种特征的。一般对于短文本的处理会借鉴上下文的语料或者同义词来扩充短文本的含义。但是由于文本的领域相关性,上下文的语料和同义词的分布未必和原始语料一致