【数据分析学习笔记day29】自然语言处理NLTK+情感分析+ 自然语言处理(NLP)+ 简单的情感分析+ 案例+使用机器学习实现

本文探讨了自然语言处理(NLP)的基本概念,包括将其转化为计算机可理解形式的过程,以及情感分析的应用。文章通过使用情感字典进行简单的情感分析,并提及AFINN-111作为实例。此外,还介绍了使用机器学习模型进行更复杂的情感分析,提供了一个具体的案例。
摘要由CSDN通过智能技术生成

情感分析

自然语言处理(NLP)

  • 将自然语言(文本)转化为计算机程序更容易理解的形式
  • 预处理得到的字符串 -> 向量化
  • 经典应用
    1. 情感分析
    2. 文本相似度
    3. 文本分类

简单的情感分析

  • 情感字典(sentiment dictionary)

    • 人工构造一个字典,如: like -> 1, good -> 2, bad -> -1, terrible-> -2
    • 根据关键词匹配
  • 如 AFINN-111: http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010,虽简单粗暴,但很实用

  • 问题:

    遇到新词,特殊词等,扩展性较差

    使用机器学习模型,nltk.classify

案例:使用机器学习实现
# 简单的例子

import nltk
from nltk.stem import WordNetLemmatizer
from nltk.corpus import stopwords
from nltk.classify 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值