文本情感分析难点和方法

二 文本情感分析的难点

文本特征较难提取
文本较难规范化
词与词之间有联系,关联关系纳入模型不容易
不带情感色彩的停用词会影响情感打分。比如:“打开天窗说亮话”。
中文复杂,同一个词在不同的语境下可能表达的语义不一样的情感。比如:“冬天能穿多少穿多少,夏天能穿多少穿多少”。
不同语义差别巨大。比如:“路上小心点”。
否定词的存在。比如:“我其实不是很喜欢你”。
各种互联网新词。比如:“SKR”。
多维情绪识别。对不同
情绪的程度级别的表示不够)

三 文本情感分析方法

情感词典:
质量好的情感词典比较少。
不带情感的停用词会影响情感打分。(因为有些停用词会加强情感)。
中文博大精深,词性的多变会影响准确性。(本来在向量表示里,每个词语是固定的维数与关系,但是实际上,中文里每个词语在不同语境意思不同)。
无法结合上下文分析情感。

高维向量模型
解决了多维语义的问题。
可以利用强大的机器学习,深度学习学习模型。

情感分析模型
有了词向量就可以使用相关模型进行情感分析。
机器学习SVM:二维分类,小数据集效果好。
神经网络模型:记忆能力,挑选必要信息进行传递。
SVM
SVM
LSTM

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值