情感分析 Kaggle 实战

今天我们来看自然语言处理中一个很重要的应用领域:情感分析。

情感分析也称为意见挖掘,是要从文本中识别和提取意见,要识别出用户对一件事一个物品或一个人的看法和态度,比如一个电影的评论,一个商品的评价,一次体验的感想等等。在这类任务中要对带有情感色彩的主观性文本进行分析,识别出用户的态度,是喜欢,讨厌,还是中立。情感分析的分析粒度可以是词语、句子、段落或篇章。

在实际生活中情感分析有很广泛的应用,例如通过对 Twitter 用户的情感分析,来预测股票走势、预测电影票房、选举结果等,还可以用来了解用户对公司、产品的喜好,分析结果可以用来改善产品和服务,还可以发现竞争对手的优劣势等等。在社交媒体监控,品牌监控,客户之声,客户服务,员工分析,产品分析,市场研究与分析等问题上都可以用情感分析。

实现情感分析的方法有很多种,可分为基于规则和自动化系统。

1. 基于规则:

指人为地制定一些用来识别态度和意见主体的规则来执行情感分析任务,需要用到标注好的情感词典。例如分析电影评论时,专门构建电影行业的情感词典,效果会比通用情感词典好很多。

一般流程为:

  1. 定义两个态度极性的词列表(例如差、最差、丑陋等负面词,好、最佳、美丽等正面词)。
  2. 给一个文本,计算文本中出现的正面词数,计算文本中出现的负面词数。
  3. 如果正面词出现的数量大于负面单词出现的数量,则返回正面情绪,反之则返回负面情绪,相等则返回中立态度。

当然这个方法非常非常

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值