宗成庆统计自然语言处理第二版第13章读书笔记-文本分类与情感分类

情感分析定义

宗老师在《统计自然语言处理》(第二版)里对情感分析做如下定义:

其任务是借助计算机帮助用户快速获取、整理和分析相关评价信息,对带有情感
色彩的主观性文本进行分析、处理、归纳和推理[Pang and Lee,2008]。情感
分析包含较多的任务,如情感分类(sentiment classification)、观点抽取
(opinion extraction)、观点问答和观点摘要等。

具体地来说,情感分析可以看成是从一段文字当中抽取含一定目的性的标签、短语或者句子等。具体的细分领域有:

很难简单地将情感分析划归为某一个领域,往往从不同的角度将其划归到不同的方向。
如果单纯地判别文本的倾向性,可以将其看作是一个分类任务;如果要从观点句中抽取
相关的要素(观点持有者、观点评价对象等),则是一个信息抽取任务;而如果要从海
量文本中找到对某一事物的观点,则可以看作是一个检索任务。目前关于情感分析的论文在各大学术会议上都有独立的专题,如ACL、EMNLP、COLING、SIGIR、CIKM等

针对一个文本分类任务来说,大体上分为四个步骤:
对于输入文档,先做文档预处理,然后对处理后的文本进行文本表示,然后输入分类器进行判别,最后输出一个文本类别,即为简约版本的文本分类任务。
在这里插入图片描述

文本表示

通常文本采用向量空间表示,向量空间模型(vector space model, VSM)

---------分割线-------2019.06.17-------

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值