基于机器学习的NLP情感分析（1）——概述

最新推荐文章于 2024-08-17 15:35:20 发布

瓦全

最新推荐文章于 2024-08-17 15:35:20 发布

阅读量1.6w

点赞数 8

分类专栏： Python 数据分析 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31150399/article/details/79758075

版权

本文介绍了情感分析的基础知识，包括简单和复杂分类任务，并探讨了基于情感词典和机器学习的两种主要方法。文章重点讲述了数据采集，如Python环境配置、爬虫技术，以及分词、向量词构造（如TF-IDF）和分类方法。

摘要由CSDN通过智能技术生成

主要参考文献

CSDN：基于机器学习的NLP情感分析（一）---- 数据采集与词向量构造方法（京东商品评论情感分析）

0 情感分析（Sentiment Analysis）

情感分析（Sentiment analysis），又称倾向性分析，意见抽取（Opinion extraction），意见挖掘（Opinion mining），情感挖掘（Sentiment mining），主观分析（Subjectivity analysis），它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。

通常情感分析任务包括如下几类（我爱公开课：斯坦福大学自然语言处理第七课“情感分析（Sentiment Analysis）”）：

简单分类Simplest task: Is the attitude of this text positive or negative?
复杂分类More complex: Rank the attitude of this text from 1 to 5
高级Advanced: Detect the target, source, or complex attitude types

主流思想：

基于情感词典：是指根据已构建的情感词典，对待分析文本进行文本处理抽取情感词，计算该文本的情感倾向，即根据语义和依存关系来量化文本的情感色彩。最终分类效果取决于情感词库的完善性，另外需要很好的语言学基础，也就是说需要知道一个句子通常在什么情况为表现为Positive和Negative。

基于机器学习：是指选取情感词作为特征词，将文本矩阵化，利用logistic Regression, 朴素贝叶斯(Naive Bayes)，支持向量机（SVM）等方法进行分类。最终分类效果取决于训练文本的选择以及正确的情感标注。

最低0.47元/天解锁文章

关注

8
点赞
踩
82

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。