【论文泛读163】用于推文中情绪检测的模糊粗略最近邻方法

190 篇文章 11 订阅
该研究提出了一种基于模糊粗糙集的分类方法,用于Twitter的情感检测。通过使用有序加权平均(OWA)算子增强的模糊粗略最近邻(FRNN)分类器,结合多种文本嵌入技术,构建集成模型。实验结果显示,即使设计简单,该方法仍能与复杂的深度学习解决方案相媲美。未来工作包括考虑文本预处理和针对不平衡数据的特殊分类方法。
摘要由CSDN通过智能技术生成

贴一下汇总贴:论文阅读记录

论文链接:《Fuzzy-Rough Nearest Neighbour Approaches for Emotion Detection in Tweets》

一、摘要

社交媒体是有意义数据的重要来源,可用于不同的任务,例如情感分析和情感识别。大多数情况下,这些任务是通过深度学习方法解决的。由于文本数据的模糊性,我们考虑使用基于模糊粗糙集的分类方法。具体来说,我们为 SemEval-2018 情绪检测任务开发了一种方法,基于使用有序加权平均 (OWA) 算子增强的模糊粗略最近邻 (FRNN) 分类器。我们使用基于不同文本嵌入方法的 FRNN–OWA 模型的调谐集成。我们的结果与基于更复杂的深度学习方法的最佳 SemEval 解决方案相比具有竞争力。

二、结论

本文设计了一个加权的FRNN-OWA分类器集成来完成情感检测任务。我们的方法使用了几个嵌入,它们大多是面向情感的,并且应用于句子级别。我们证明了我们的方法,尽管设计简单,但与竞争对手的获胜方法相比是有竞争力的,这些方法都是黑盒。

作为一个可能的改进,我们可以考虑额外的文本准备步骤,例如,在嵌入步骤之前,对哈希表和表情符号或感叹号使用更大的权重。

最后,我们假设恐惧数据集的较低PCC分数可能与数据集的不平衡有关。作为解决这个问题的一种可能方法,我们可以对不平衡的数据使用特定的分类机器学习方法。例如,在本文中,描述了几种专门针对不平衡数据集的模糊粗糙集理论方法。

三、model

整体架构(每个特征一个独立的模型):
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值