情感分析思想(基于各种词典)

之前在实习时,teamleader想利用情感分析实现“公司绩效考核”问题,即从Boss对员工的评语中判断该员工该月的绩效值,属情感分析领域。

当时使用最简单的基于情感词典的方法解决,借鉴了这篇文章,在此基础上对其进行修改,先讲思路描述如下。

1  词典准备

  • 情感词典(BosonNLP情感词典)
  • 停用词典
  • 否定词典
  • 程度副词词典

注:情感词典内包含词语以及对应的情感值;停用词典只包含停用词语;否定词典只包含否定词语;程度副词词典内包含词语及对应的程度值。

2  实施步骤

整体步骤如下:

  1. 分词(jieba),去停用词;
  2. 构建词语序列;
  3. 对词语序列结果分类,找出情感词、否定词、程度副词;
  4. 计算得分。

其中计算得分的具体步骤如下:

  1. 找出所有情感词的下标,构建新词组;
  2. 新词组构建方法:该情感词与前一情感词之间的否定词及程度副词 + 该情感词(第一个情感词前至句首);
  3. 计算:程度副词的程度值 × 情感词的情感值,每有一个否定词,使该式 × -1;
  4. 句子累加。

缺点:

  1. 没有考虑词义,特别对于“标题党”来讲,结果差距巨大。但这种情况都需要使用深度学习的方法才能有效解决,普通机器学习方法也是很难的。
  2. 对于正负向文本的判断,该算法忽略了很多其他的否定词、程度副词和情感词搭配的情况;用于判断情感强弱也过于简单。

转载于:https://www.cnblogs.com/qijunhui/p/9929734.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于情感词典的文本情感分析是一种常见的情感分析方法。它的基本思想是,通过构建一个情感词典,将文本出现的词语与情感词典的情感词进行匹配,然后根据匹配结果对文本的情感进行分析和判断。 情感词典通常包含两类词语:情感词和情感强度词。情感词是指直接表示情感色彩的词语,如“喜欢”、“悲伤”等,而情感强度词则表示情感的强度或程度,如“非常”、“极其”等。在使用情感词典进行情感分析时,可以根据文本出现的情感词和情感强度词,计算文本的情感得分,进而判断文本的情感倾向。 具体的情感分析流程如下: 1. 构建情感词典,包括情感词和情感强度词。 2. 对待分析的文本进行分词,得到文本的词语列表。 3. 针对每个词语,在情感词典查找对应的情感词和情感强度词。 4. 根据匹配结果,计算文本的情感得分。通常采用简单的加权求和方法,将情感词的得分和情感强度词的得分相加。 5. 根据情感得分判断文本的情感倾向,通常将情感得分划分为积极、性、消极三类。 需要注意的是,基于情感词典情感分析方法存在一些缺点,例如无法处理复杂的语义结构和上下文信息,容易受到词语歧义和多义性的影响等。因此,在实际应用,需要结合其他情感分析方法,进行综合分析和判断。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值