句子情感分类(正负)——2015A joint segmentation and classification framework

该文章提出一种解决句子中短语及其单词情感不一致的模型,通过联合训练句子分割和分类器。模型包含候选生成、划分排序和情感分类三个层次,使用特征抽取器,并在实验中对比了不同方法的效果。
摘要由CSDN通过智能技术生成

这是Tang Duyu 在2015发表在TASLP上的一篇文章。中心思想是通过同时训练句子划分和句子分类解决句子中短语和其构成单词情感不一致的问题。本文模型的核心就是提出了句子分割模型作为模型的一部分,而不是简单的把句子划分成一个个单词,以单词作为计算单元。模型分为三个层次:候选生成模型,划分排序模型,情感分类器。分类器训练结果的误差反向传播,不仅用于更新分类器,而且用来更新分割排序模型,使得分割模型不断优化,得到的分割结果对分类尽可能有用。


在摘要部分,作者就明确表明本文是为了解决句子中短语及其组成部分的情感不一致问题。对于模型的使用也有两种方法,一个是训练,一个是预测。

首先讲训练过程。

  • 为每个句子生成至少一个划分
  • 随机选择一个划分结果,利用它的分类特征初始化情感分类器
  • 随机初始化划分打分模型
  • 联合训练分类器和划分模型:对每个划分结果,利用当前的分类器预测其情感,然后利用他们更新划分打分模型。再利用新的划分打分模型更新分类器:首先对每个划分候选抽取划分特征,用这些特征计算得分,对每个句子选择得分最高的前k个划分,用这k个划分结果训练分类器。
  • 经过R次迭代,得到分类器和划分打分器。
而预测过程比较简单,只需要为每个句子生成一组划分,利用打分模型排序,对每个句子选择前k个划分,再利用分类器分类,选择k个分类中预测的主要情感作为句子的情感。

在这里先说明模型中用到的两个特征抽取器:划分特征抽取器和分类特征抽取器。划分特征抽取器是用来计算句子的一个划分得分的,包括embedding特征和面向分割的特征;而分类特征抽取器抽取的特征用作分类器的输入

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值