ACL 2020 | 消除文本分类问题中歧视现象的研究

最新推荐文章于 2024-07-06 01:44:58 发布

PaperWeekly

最新推荐文章于 2024-07-06 01:44:58 发布

阅读量821

点赞数

文章标签：机器学习人工智能深度学习自然语言处理数据挖掘

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/107421048

版权

该研究揭示了文本分类数据集中的歧视问题，指出模型可能学习到歧视模式，导致对某些群体的不公平预测。提出了一种基于实例加权的无歧视学习方法，有效减轻模型的歧视性预测，已在ACL 2020会议上发表。

摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者｜张冠华、白冰

研究机构｜哈工大/腾讯

研究方向｜自然语言处理

导语

文本分类问题是自然语言处理中的一个基础问题，旨在根据语义预测一句话的标签。常见的文本分类任务包括情感检测、意图分析等。最近，学术界发现文本分类数据集常常包含对某些群体的歧视，这是因为这些数据集反映了人类社会中普遍存在的偏见。

机器学习在这些有歧视的数据集中训练时，也会学习到这些歧视的模式，从而产生歧视性的预测结果。比如，模型可能会仅仅因为句子中的“女人”一词就把“我是一个女人”判断为侮辱性语句。

本文探究了文本分类中歧视问题的形式化定义，并提出了一种基于样本加权的无需额外数据的模型去歧视方法。实验结果表明我们的方法可以有效缓解模型预测过程中对弱势群体的歧视问题。本文章已经被 ACL 2020 录取。

论文标题：Demographics Should Not Be the Reason of Toxicity: Mitigating Discrimination in Text Classifications with Instance Weighting

论文链接：https://arxiv.org/abs/2004.14088

代码链接：https://github.com/ghzhang233/Non-Discrimination-Learning-for-Text-Classification

问题背景

文本分类问题是自然语言处理中的一个基础问题，旨在根据语义预测一句话的标签。常见的文本分类任务包括情感检测、意图分析等。

最近，学术界发现文本分类数据集常常包含对某些群体的歧视, 这是因为这些数据集反映了人类社会中普遍存在的偏见。具体地，这种歧视表现为在数据集中某些群体对特定标签有明显的倾向性。比如在 Toxicity Comments 数据集中，如下表所示，我们可以看出一些群体词如 “gay” 与标签 “Abusive” 有着很强的关联。