情感分析(Emotion Detector)

情感分析在产品改进中发挥关键作用,包括基于情感词典的传统方法和基于深度学习的算法。传统方法依赖词典进行文本匹配,简单但精度有限;深度学习方法则提供更高精度,但面临长序列和新词处理挑战。
摘要由CSDN通过智能技术生成

1 概述

情感分析是自然语言处理中常见的场景,比如淘宝商品评价,饿了么外卖评价等,对于指导产品更新迭代具有关键性作用。通过情感分析,可以挖掘产品在各个维度的优劣,从而明确如何改进产品。比如对外卖评价,可以分析菜品口味、送达时间、送餐态度、菜品丰富度等多个维度的用户情感指数,从而从各个维度上改进外卖服务。
情感分析可以采用基于情感词典的传统方法,也可以采用基于深度学习的方法,下面详细讲解

2 基于情感词典的传统方法

2.1 基于词典的情感分类步骤
基于情感词典的方法,先对文本进行分词和停用词处理等预处理,再利用先构建好的情感词典,对文本进行字符串匹配,从而挖掘正面和负面信息。如下图
在这里插入图片描述
2.2 情感词典
情感词典包含正面词语词典、负面词语词典、否定词语词典、程度副词词典等四部分。如下图
在这里插入图片描述
词典包含两部分,词语和权重,如下

正面:
很快  1.75
挺快  1.75
还好  1.2
很萌  1.75
服务到位    1

负面:
无语  2
醉了  2
没法吃  2
不好  2
太差  5
太油  2.5
有些油  11
一般  0.5

程度副词:
超级  221.751.5
实在  1.75

否定词:
不   1111111

情感词典在整个情感分析中至关重要,所幸现在有很多开源的情感词典,如BosonNLP情感词典,它是基于微博、新闻、论坛等数据来源构建的情感词典,以及知网情感词典等。当然我们也可以通过语料来自己训练情感词典。

2.3 情感词典文本匹配算法
基于词典的文本匹配算法相对简单。逐个遍历分词后的语句中的词语,如果词语命中词典,则进行相应权重的处理。正面词权重为加法,负面词权重为减法,否定词权重取相反数,程度副词权重则和它修饰的词语权重相乘。如下图
在这里插入图片描述
利用最终输出的权重值,就可以区分是正面、负面还是中性情感了。
2.4 缺点
基于词典的情感分类,简单易行,而且通用性也能够得到保障。但仍然有很多不足

精度不高。语言是一个高度复杂的东西,采用简单的线性叠加显然会造成很大的精度损失。词语权重同样不是一成不变的,而且也难以做到准确。
新词发现。对于新的情感词,比如给力,牛逼等等,词典不一定能够覆盖
词典构建难。基于词典的情感分类,核心在于情感词典。而情感词典的构建需要有较强的背景知识,需要对语言有较深刻的理解,在分析外语方面会有很大限制。

3 基于深度学习的算法

近年来,深度学习在NLP领域内也是遍地开花。在情感分类领域,我们同样可以采用深度学习方法。基于深度学习的情感分类,具有精度高,通用性强,不需要情感词典等优点。

3.1 基于深度学习的情感分类步骤
基于深度学习的情感分类,首先对语句进行分词、停用词、简繁转换等预处理,然后进行词向量编码,然后利用LSTM或者GRU等RNN网络进行特征提取,最后通过全连接层和softmax输出每个分类的概率,从而得到情感分类。
在这里插入图片描述
3.2 基于深度学习的情感分析难点
基于深度学习的情感分析难点也很多
语句长度太长。很多用户评论都特别长ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值