中文评价对象提取以及NLP基础

前言在CNCC开会的时候,收到一个问询:中文评价对象抽取的方法和开源工具。一番谷歌度娘论文阅读,撰文如下,欢迎指正。任务界定情感分析主要是针对主观性文本单元自动获取有价值的意见信息,是一个新颖且非常有应用价值的研究课题
摘要由CSDN通过智能技术生成

前言

在CNCC开会的时候,收到一个问询:中文评价对象抽取的方法和开源工具。一番谷歌度娘论文阅读,撰文如下,欢迎指正。

任务界定

情感分析主要是针对主观性文本单元自动获取有价值的意见信息,是一个新颖且非常有应用价值的研究课题[1]。评价对象抽取和倾向性分析属于情感分析的两个子任务。
一句商品评论如:为发烧而生的手机,非常的亲民,速度非常的快,手感很轻柔,很舒服。摄像效果惊人,夜景效果非常的好,小米係统的很多功能我正在探索中,很好玩。是一款低调奢华有内涵的好手机,为雷军大赞。为京东的快递小哥也点个满意的赞。
这里写图片描述
抽取结果:
目标对象:小米手机(银3GB 64GB)
评价对象:(速度)快,(手感)轻柔,(摄像效果)好……
倾向性:五星好评

解决方案

基线方案

以2010年刘鸿宇等的工作[1](研究情感句中的评价对象抽取及其情感倾向性判断任务; 作为基础入门,哈工大的综述文本情感分析值得[2]强烈推荐)作为传统解决方案的例子。刘将任务分为两个主要阶段:
1. 自动识别情感句中的评价对象
2. 判别情感句中评价对象的情感倾向性
刘鸿宇等认为于评价对象的获取,已有的方法主要可以归为两类:人工构建[3]和关联规则挖掘[4-5]
判断情感极性主要是:有监督方法(Kim和Hovy使用词、位置以及情感词三类特征来对情感句进行分类[6]、赵军等人使用CRF和冗余标签对句子序列进行情感倾向性标注[7])、无监督方法(基于句法规则的方法[3,5]
刘等采用的是无监督的方法,在第一届中文倾向性分析评测取得优秀结果。系统框架图如下所示这里写图片描述
刘的大体思路是:
1使用句法分析,找出名词和名词短语作为候选的评价对象
2使用三种过滤技术(词频过滤、PMI过滤、名词裁剪)削减候选集合,主要思路还是设置不同的阈值依靠出现频率和共现频率删除候选集(不停的试错)
3句子划分成四类,基于规则,比如情感词的的级性、数量(否定词)、上下文级性。
句子带有明显的倾向性,即句子中带有一种倾向性的上下文无关情感词明显多于另一种
句子不带有明显的倾向性,但句子中含有情感词,且褒义和贬义情感词的个数相同
句子不带有明显的倾向性,且句子中没有情感词,但其上下文的句子带有

  • 5
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值