解析-文本分类
文章平均质量分 86
解析-文本分类
nopSled
一周一更
展开
-
“Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors翻译
文本分类是自然语言处理(NLP)中最基本的任务之一,在神经网络的帮助下已取得巨大提升。但是,大多数神经网络都是需要大量标注数据,这种需求随参数数量而增加。必须针对不同的数据集仔细调整超参数,并且需要针对特定模型和数据集量身定制文本数据的预处理(例如,tokenization,停用词删除)。尽管它们能够捕获潜在的相关性并识别隐式模式,但复杂的深度神经网络对于简单任务(例如主题分类)可能过于大材小用了,而较轻量化的替代方案通常就足够好。翻译 2023-07-20 15:27:14 · 297 阅读 · 1 评论 -
文本分类|基于xlnet和归纳网络的小样本文本分类模型(用于意图识别)实现及代码开源
由于我主要研究问答系统,因此本博客仅更新NLP及问答相关内容,最近创了一个群,如果大家感兴趣可加q群号:376564367github:https://github.com/makeplanetoheaven/NlpModel/tree/master/SpeechRecognition/AcousticModel/dfsmn_v2背景知识本篇文章所实现的基于xlnet和归纳网络的小样本文本分...原创 2020-04-22 15:29:44 · 2955 阅读 · 1 评论 -
Investigating Capsule Networks with Dynamic Routing for Text Classification翻译
摘要在这项研究中,我们探索将具有动态路由的胶囊网络用于文本分类任务。我们提出了三种策略来稳定动态路由过程,以减轻某些可能包含“背景”信息或尚未成功训练的噪声胶囊的干扰。使用胶囊网络在六个文本分类基准上进行了一系列实验。 在6个数据集中的4个数据集上,胶囊网络在比较基线方法上取得了竞争性结果,这表明了胶囊网络在文本分类中的有效性。 我们还展示,当通过竞争者将单标签文本分类转移到多标签文本分类时,胶...翻译 2019-12-09 11:05:04 · 456 阅读 · 0 评论 -
Induction Networks for Few-Shot Text Classification翻译
摘要当数据不足或需要适应看不见的类时,文本分类往往会遇到困难。在这种具有挑战性的情况下,最近的研究使用元学习来模拟小样本任务,在该任务中,将新问题与样本级别的小型支持集进行比较。但是,这种基于样本的比较可能会受到同一类中各种表达式的严重干扰。因此,我们应该能够学习支持集中每个类的一般表示,然后将其与新问题进行比较。在本文中,我们提出了一种新颖的归纳网络,通过在元学习中创新地利用动态路由算法来学习...翻译 2019-11-12 10:21:55 · 2817 阅读 · 0 评论 -
Hierarchical Attention Networks for Document Classification翻译
摘要我们提出了一种用于文档分类的分层注意力网络。我们的模型有两个显著特征:(i)它具有反映文档层次结构的层次结构; (ii)它在单词和句子级别应用了两个不同的注意力机制,使其能够在构建文档表示时区别地参与越来越重要的内容。在六个大规模文本分类任务上进行的实验表明,所提出的架构在很大程度上优于以前的方法。注意力层的可视化说明该模型能够选择有用的单词和句子信息。1.介绍文本分类是自然语言处理的基...翻译 2019-05-24 11:19:21 · 1489 阅读 · 0 评论