融合标签层级结构的文本分类
1、背景
1、作者(第一作者和通讯作者)
刘翰错,黄贤英
2、单位
重庆理工大学
3、年份
2021
4、来源
山西大学学报(自然科学版)
2、四个问题
1、要解决什么问题?
解决标签之间的语义、标签之间的相关性,文本特征对标签特征的影响。
2、用了什么方法解决?
提出了融合标签结构的层级标签文本分类模型(Label Hierarchical and Semantic Structure Learning, LHSSL)
3、效果如何?
4、还存在什么问题?
论文笔记
0、引言
在本小节中,作者总结了目前现有的层级文本分类主要有两种:
关注局部:关注局部 ,倾向于构造多个层次分类模型,然后以自顶向下的方式遍历层次结构。每个分类器预测对应的类别或类别层次。
关注全局:关注全局,将所有类别集合在一起,用单个分类器进行预测。
作者指出这些方法忽略了标签的语义结构特征、层级结构特征以及它们与输入文本特征之间的关系。还指出当标签数量较大、标签相似度较高时,人工分类很困难。接着作者针对以上问题提出了层级标签文本分类模型(LHSSL):
(