论文阅读--A Tutorial on Stance Detection

论文链接:https://dl.acm.org/doi/pdf/10.1145/3488560.3501391

摘要

        立场检测(也称为立场分类、立场预测和立场分析)是与社交媒体分析、自然语言处理和信息检索相关的问题,旨在从一段文本中确定一个人的位置oward a target (a concept, idea, event, etc.) 要么在文本中明确指定,要么仅暗示。

        常见的立场类别包括赞成、反对和无。在本教程中,我们将定义核心概念其他相关研究问题,介绍历史和现在的历史检测方法(包括共享任务和使用的工具),提供相关数据集的指针,并涵盖立场检测领域的开放的研究方向和应用。由于立场检测的解决方案可以促进多种应用,包括趋势分析、民意调查、用户评论、个性化以及公投和选举的预测,它将继续作为一个重要的研究问题,目前主要针对文本内容,特别是在包括社交媒体在内的网络内容上。

CCS 概念 • 计算方法 → 自然语言处理;机器学习;语言资源; • 信息系统→信息检索;网络和社交媒体搜索;情感分析。

关键词 立场检测,社交媒体分析,推特,数据流

1引言

        立场检测最近已成为自然语言处理 (NLP)、社交媒体分析和信息检索 (IR) 中的一个重要研究问题,特别是自 2015 年以来发表的相关论文数量表明 [15]。它是一个被认为与情感分析密切相关的研究课题,通常被定义为检测文本生成者对目标的立场(如赞成、反对或无)[22、23]。除了情绪分析,还有其他与立场检测密切相关的研究问题,包括情绪检测、讽刺检测、反讽检测、争议检测、论点挖掘等。

        众所周知,立场检测有几个应用领域,例如选举/公投结果预测、信息检索、谣言分类和假新闻检测。特别是基于后两个应用领域,出现了两个立场检测子问题,即谣言立场检测和假新闻立场检测[15]。本教程将提供这些子问题以及其他子问题(多目标立场检测 [27] 和跨目标立场检测 [39])的定义。

        对立场检测研究的一个重要贡献是 2016 年至 2017 年间一系列关于立场检测的共享任务:一项关于英文推文 [22] 的初始竞赛(在 SemEval-2016 课程中),另一项关于中文微博帖子的竞赛 [40],以及另一个关于西班牙语和加泰罗尼亚语推文的相关竞赛 [31]。最近,还对意大利语推文执行了立场检测共享任务 [6]。另一个关于西班牙语和巴斯克语推文的相关共享任务最近再次进行 [18]。除了评估不同语言微博上的不同立场检测方法外,这些竞赛还促进了编译重要的注释数据集 [6、18、21、22、40] 用于立场检测。

        早期的立场检测工作在各种文本类型上使用不同的基于规则和基于机器学习的算法,包括国会辩论、在线辩论论坛、学生论文和推文 [8、9、25、32]。在上述关于英语推文中立场检测的初始共享任务之后,相关研究似乎显着增加 [22]。因此,特别考虑在(包括)这项共同任务之后的那些研究;传统的机器学习方法,如 SVM [1, 11, 12, 22, 23, 26, 38] 和逻辑回归 [6, 24, 41, 42],深度学习方法,如 LSTM [2, 7, 28, 29, 36]和 CNN [35、37、43] 和集成方法 [20、30、33] 都已用于立场检测任务。尽管像 SVM 这样的机器学习方法是 2019 年之前最常用的方法,但最近的研究倾向于应用深度学习算法,类似于 NLP 和 IR [15] 中许多任务的情况。

        还有大量的研究工作来生成用于立场检测的注释数据集 [14、17、27、44]。目前,存在多种语言的立场注释数据集,包括英语[21、27]、加泰罗尼亚语[31]、中文[40]、捷克语[10]、意大利语[19]、西班牙语[31]、土耳其语[13、14] ],和巴斯克语 [18]。然而,除了这些特定于语言的数据集之外,最近关于多语言立场注释数据集[17、34、44](这些数据集包括德语和法语等其他语言的注释样本)的编译工作将促进相关研究,从而有望导致重要的发现。

        在对立场检测问题有了一定的认识之后,今后的研究方向有几个。

        例如包括跨语言和多语言立场检测[15]、数据流中的立场检测[3]、非文本内容的立场检测、上下文敏感的立场检测[15],以及探索新方法的应用机会[ 4, 5]。

        本教程旨在涵盖姿态检测的核心概念以及相关研究主题、迄今为止发表的解决该问题的重要方法、相关数据集和其他实用资源、应用领域,最后是相关文献中尚未充分解决的突出问题.我们相信本教程将对 Web 搜索、NLP 和 IR 等感兴趣的研究人员以及相关从业者有所帮助。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值