基于权值的句子情感分析

        主要目的是以句子为基本单位,判断句子的情感状态。主要思路是对于句子中的每个词语,根据一定规则赋予权值,统计句子所包含的所有词语的权值之和,若权值为正,则表示句子的情感状态为积极的,若句子的权值为负,则表示句子的情感状态为负,若为0表示中立的句子。

         具体的步骤分为:

1.语料预处理

         读入的语料可以是包含单个句子的文本也可以是多个句子的文本,对输入的语料进行分句处理,然后对每一个句子分词,存储每个句子所包含的词语。

2.计算词语权值

        人工制定两个情感词典:正向词语词典和负向词语词典,分别存储正向和负向词语,对句子中的每个词语判断是否包含在正向或者负向词典中。若包含在正向词典中,则词语的权值为+1,若存在于负向词典中,则词语的权值为-1。

       分别制定一个包含修饰词语(程度词语)的词典和表示否定意义的词典。对于每一个出现在情感词典中的词语判断该词语之前是否存在否定词语,若存在,则该词语的权值符号取反,若存在修饰词语(表示程度的词语),则词语的权值按照一定比例系数提升如1.5.

       对于句子中所有的情感词语,根据其位置赋予位置权重。若句子包含的情感词语数目为M,则根据出现在原文中的先后次序,最后一个位置的词语位置系数为2/M,即采用此系数与当前词语的权值相乘作为最后的权值,其余位置词语的位置系数为1/M。

3.统计句子中词语的权值

统计每一个句子中所有词语最终的权值之和,根据句子权值正负性判断句子的情感状态。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值