IJCNLP2015-Weakly Supervised Models of Aspect-Sentiment for Online Course Discussion Forums阅读笔记

本文探讨了在大规模开放在线课程(MOOCs)论坛中利用弱监督模型来识别帖子的课程主题(aspect)和情感(sentiment),以改善教师对学生需求的理解和响应。提出了一种基于铰链损耗马尔科夫随机场(HL-MRF)的模型,该模型在无需大量标注数据的情况下,提高了aspect和sentiment预测的准确性。
摘要由CSDN通过智能技术生成

这篇文章的启发主要是aspect和sentiment之间的联系可以设置一些规则实现。

 

Abstract 

大量开放的在线课程 (MOOCs) 正在重新定义教育系统, 超越传统课程所构成的界限。随着在线课程的普及程度的提高, 理解和解释课程参与者的沟通需要相应的增加。在在线课程论坛帖子中确定谈话的主题或内容并推断情绪, 可以使教师干预能够满足学生的需要, 迅速解决与课程相关的问题, 并提高学生的保留能力。标记的aspect-MOOCs 的情绪数据是昂贵的获取和可能无法在课程之间转移, 表明需要不需要标签的数据的方法 。我们在在线课程中建立了一个弱监督的 aspect-sentiment 连接模型, 用最近开发的可伸缩类的统计关系模型 (称为铰链损耗马尔科夫随机场) 建模了各个方面和情绪之间的依赖性。我们在十二个在线课程的样本上验证我们的模型, 每一个都包含1万个帖子, 并证明与情绪共同建模方面提高了预测的准确性, 为方面和情绪。

 

Introduction 

由于以下几个原因, 自动识别这些报告的问题很重要:

  1. 在 MOOCs 中, 由于教师和学生 比例偏高, 教师手动筛选所有帖子是很耗时的,
  2.  迅速解决问题, 可以帮助提高学生的留存率,
  3. 今后的课程迭代可以从确定学生目前面临的技术和后勤问题中获益。本文研究了确定帖子的细粒度主题的问题 (我们称之为 "MOOC"的aspect) 和对他们的看法, 这可能会被用来改进课程。

 

 

目前的困境:

  1. 可能只有5-10%的帖子和aspect有关
  2. 标签标注花费太大,并且数据被私有化难以获取

 

我们设计了一个弱监督系统来决定帖子的aspect和sentiment。我们的系统能通过微小的修改或者不用修改,就能适用于所有MOOC论坛。贡献主要为以下几点:

  1. 我们展示了怎么在有种子词的情况下编码弱监督,用SeededLDA -一个变化的种子主题模型(Jagarlamudi et al., 2012 )来抽取MOOC中特殊课程的特征。
  2. SeededLDA 的基础上,我们提出了aspect和sentiment 的共同模型,使用hinge-loss Markov random field (HL-MRF) 概率建模框架。这个框架十分适合这个问题,因为他能从多个特征和aspect sentiment 的共同推论中组合信息
  3. 为了证实我们的系统的有效性,我们通过抽取12个MOOC课程的帖
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

catbird233

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值