论文推荐丨MASKER：用于可靠文本分类的掩蔽关键字正则化

AMiner学术搜索和科技情报挖掘

于 2020-12-24 19:36:56 发布

阅读量520

点赞数

分类专栏： AMiner论文推荐文章标签：机器学习深度学习人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AI_Conf/article/details/111648825

版权

AMiner论文推荐专栏收录该内容

515 篇文章 52 订阅

订阅专栏

MASKER是一种针对预先训练的语言模型的微调技术，旨在增强模型的可靠性，尤其是在OOD检测和跨域泛化方面。通过掩蔽关键字并鼓励模型基于上下文重建，MASKER减少了模型对孤立关键字的过度依赖，从而提高模型的上下文理解能力。实验证明，这种方法可以在保持分类精度的同时，改善模型在异常检测和不同领域泛化的能力。

摘要由CSDN通过智能技术生成

论文名称：MASKER: Masked Keyword Regularization for Reliable Text Classification

论文链接：https://www.aminer.cn/pub/5fdc7f5891e01104c9181075/

推荐理由：预先训练的语言模型已经在各种文本分类任务上达到了最先进的准确性，例如情感分析、自然语言推理和语义文本相似性。然而，经过调优的文本分类器的可靠性是一个经常被忽视的性能标准。例如，一个人可能想要一个模型，它可以检测出分布异常(OOD)样本(从远离训练分布的地方抽取)，或者对域转移具有鲁棒性。我们认为，可靠性的一个主要障碍是模型对有限数量的关键字的过度依赖，而不是查看整个上下文。特别地，我们发现(a) OOD样本通常包含独立关键字，而(b)跨域样本可能不总是包含关键字;在这两种情况下，过度依赖关键字都会带来问题。根据这一观察，我们提出了一种简单但有效的微调方法，即掩蔽关键字正则化(MASKER)，它有助于基于上下文的预测。MASKER将该模型正则化，从剩余的单词重建关键字，并在没有足够上下文的情况下进行低置信度预测。当应用于各种预先训练的语言模型(如BERT、RoBERTa和ALBERT)时，我们证明掩码器在不降低分类精度的情况下改善了OOD检测和跨域泛化。

订阅了解更多论文信息，定制您的个人科研动态信息流：https://www.aminer.cn/user/notification

#论文# #AMiner#
在这里插入图片描述

AMiner学术搜索和科技情报挖掘

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。