自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 【层级文本分类】MATCH: Metadata-Aware Text Classification in A Large Hierarchy

多标签文本分类是指从标签集中为每个给定文档分配其最相关标签的问题。通常,给定文档的元数据和标签的层次结构在现实世界的应用程序中是可用的。然而,大多数现有研究只关注对文本信息进行建模,少数尝试利用元数据或层次结构信号,但不是两者兼而有之。在本文中,我们通过在大型标签层次结构(例如,具有数万个标签)中形式化元数据感知文本分类问题来弥合差距。为了解决这个问题,我们提出了 MATCH1 解决方案——一个利用元数据和层次结构信息的端到端框架。为了合并元数据,我们在同一空间中预训练文本和元数据的嵌入,并利用全连接注意力

2022-09-06 11:58:07 931 1

原创 【层级文本分类】Constrained Sequence-to-Tree Generation for Hierarchical Text Classification

层次文本分类(HTC)是一项具有挑战性的任务,其中可以将文档分配给分类法中的多个层次结构类别。以往的研究大多认为HTC是一个扁平的多标签分类问题,这必然会导致“标签不一致”问题。在本文中,我们将HTC定义为一个序列生成任务,并引入一个序列到树的框架(Seq2Tree)来建模分层标签结构。此外,我们还设计了一个带有动态词汇表的约束解码策略,以保证结果的标签一致性。与之前的工作相比,本文提出的方法在三个基准数据集上取得了显著而一致的改进。

2022-09-02 11:08:26 674

原创 【层级多标签文本分类】Hierarchy-aware Label Semantics Matching Network for Hierarchical Text Classification

由于标签层次结构的复杂性,分层文本分类是一项重要而富有挑战性的工作。现有方法忽略了文本与标签之间的语义关系,不能充分利用层次信息。为此,我们将文本标签语义关系定义为语义匹配问题,并提出了一种分层感知标签语义匹配网络(HiMatch)。首先,我们将文本语义和标签语义投影到一个联合嵌入空间。然后我们引入联合嵌入损失和匹配学习损失来建模文本语义和标签语义之间的匹配关系。我们的模型以层次感知的方式捕获粗粒度标签和细粒度标签之间的文本标签语义匹配关系。在各种基准数据集上的实验结果验证了我们的模型达到了最先进的结果。.

2022-09-01 14:38:47 2092

原创 【层次化文本分类】Hierarchy-Aware Global Model for Hierarchical Text Classification

层次化文本分类是具有分类层次的多标签文本分类的重要组成部分,也是一个具有挑战性的子任务。现有方法难以在全局视图中对分层标签结构进行建模。此外,它们不能充分利用文本特征空间和标签空间之间的相互作用。在本文中,我们将层次表示为有向图,并引入层次感知结构编码器来建模标签依赖。在层次化编码的基础上,提出了一种端到端的层次化全局模型(HiAGM)。多标签注意变量(HiAGM-LA)通过层次编码器学习层次感知标签嵌入,并对标签感知文本特征进行归纳融合。提出了一种文本特征传播模型(HiAGM-TP)作为演绎变量,将文本特

2022-08-31 16:41:05 3009

原创 【层级多标签文本分类】Incorporating Hierarchy into Text Encoder: a Contrastive Learning Approach for Hierarchic

层次文本分类是多标签分类的一个极具挑战性的子任务,因为它的标签层次结构复杂。现有方法分别对文本和标签层次进行编码,并混合它们的表示用于分类,其中所有输入文本的层次保持不变。在本工作中,我们提出了层次制导的对比学习(HGCLR)来直接将层次结构嵌入到文本编码器中,而不是分别对它们进行建模。在训练过程中,HGCLR在标签层次的指导下为输入文本构造正样本。通过将输入文本及其正样本放在一起,文本编码器可以学习独立地生成分层感知的文本表示。因此,经过训练后,HGCLR增强型文本编码器可以省去冗余层次结构。在三个基准数

2022-08-26 16:39:20 2198 1

原创 【层级多标签文本分类】HFT-CNN: Learning Hierarchical Category Structure for Multi-label Short Text Categorizati

类别层次结构(HS),该方法利用类别之间的层次关系来解决数据稀疏问题。HS层次越低,分类性能越差。因为较低的类别是细粒度的,每个类别的训练数据量比较高级别的要小得多。解决HS低层次的分类问题。

2022-08-25 16:24:09 760

原创 Python中Logging 日志模块

Logging库是非常常用的记录日志库,通过logging模块存储各种格式的日志,主要用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等

2022-07-15 10:24:53 800 1

原创 import argparse 模块

argparse 模块学习

2022-07-14 18:27:53 4303

原创 【层级多标签文本分类】Hierarchical Multi-label Text Classification: An Attention-based Recurrent Network Approa

本文提出了一种新的基于层次注意力的递归神经网络(HARNN)框架,通过整合文本和层次类别结构,将文档逐级分类到最相关的类别中。具体地说,我们首先应用文档表示层来获得文本的表示和层次结构。然后,我们开发了一个基于注意力的递归层次,以自上而下的方式对层次结构中不同层次之间的依赖关系进行建模。本文提出了一种层次化注意策略来捕捉文本与层次化结构之间的关联。最后,我们设计了一种混合方法,它能够预测每一层的类别,同时对整个层次结构中的所有类别进行准确的分类。......

2022-07-13 17:59:03 2644

原创 【层级多标签文本分类】科技资源文本层次多标签分类方法

AHMCA通过整合文本、关键词、层次结构等特征构造注意力机制层,对 HMCN-F网络进行改进,将科技资源文档逐级分类到最相关的类别中。

2022-07-04 16:35:42 583

原创 【层级多标签文本分类】融合标签层级结构的文本分类

LHSSL充分利用了标签语义结构与层级结构信息,通过共享参数的图卷积神经网络学习两种结构的相似特征。然后将标签特征与文本特征动态连接,构造标签模拟分布作为softtarget。

2022-07-02 16:05:00 2278

原创 【层级多标签文本分类】基于预训练语言模型的BERT-CNN多层级专利分类研究

专利分类作为文本分类中的一个垂直领域,标签有多层级、多标签的特点,不像做新闻分类、情感分类很多时候标签单一、且简单、都是自定义的。所以专利分类写论文更有“点”可写。

2022-06-30 19:06:07 2109

原创 【层级多标签文本分类】MSML-BERT 模型的层级多标签文本分类方法研究

层级多标签文本分类相比普通的多标签文本分类更具有挑战性,因为文本的多个标签组织成树状的层次结构。当前方法使用相同的模型结构来预测不同层级的标签,忽略了它们之间的差异性和多样性。并且没有充分地建模层级依赖关系,造成各层级标签尤其是下层长尾标签的预测性能差,且会导致标签不一致性问题。...

2022-06-29 08:02:00 4312 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除