python情感词提取_Python 文本挖掘:使用情感词典进行情感分析(算法及程序设计)...

本文介绍了Python进行情感分析的基本步骤,包括识别情感词、考虑程度词、感叹号、否定词的影响,以及如何计算情感分值。算法设计包括分句、查找情感词、处理程度和否定词、考虑感叹号、计算分句情感值和评论情感值。最后,文章提到了实际应用中的代码实现和情感词典的使用。
摘要由CSDN通过智能技术生成

出处:http://www.ithao123.cn/content-242299.html

情感分析就是分析一句话说得是很主观还是客观描述,分析这句话表达的是积极的情绪还是消极的情绪。

原理

比如这么一句话:“这手机的画面极好,操作也比较流畅。不过拍照真的太烂了!系统也不好。”

① 情感词

要分析一句话是积极的还是消极的,最简单最基础的方法就是找出句子里面的情感词,积极的情感词比如:赞,好,顺手,华丽等,消极情感词比如:差,烂,坏,坑爹等。出现一个积极词就+1,出现一个消极词就-1。

里面就有“好”,“流畅”两个积极情感词,“烂”一个消极情感词。那它的情感分值就是1+1-1+1=2. 很明显这个分值是不合理的,下面一步步修改它。

② 程度词

“好”,“流畅”和‘烂“前面都有一个程度修饰词。”极好“就比”较好“或者”好“的情感更强,”太烂“也比”有点烂“情感强得多。所以需要在找到情感词后往前找一下有没有程度修饰,并给不同的程度一个权值。比如”极“,”无比“,”太“就要把情感分值*4,”较“,”还算“就情感分值*2,”只算“,”仅仅“这些就*0.5了。那么这句话的情感分值就是:4*1+1*2-1*4+1=3

③ 感叹号

可以发现太烂了后面有感叹号,叹号意味着情感强烈。因此发现叹号可以为情感值+2. 那么这句话的情感分值就变成了:4*1+1*2-1*4-2+1 = 1

④ 否定词

明眼人一眼就看出最后面那个”好“并不是表示”好“,因为前面还有一个”不“字。所以在找到情感词的时候,需要往前找否定词。比如”不“,”不能“这些词。而且还要数这些否定词出现的次数,如果是单数,情感分值就*-1,但如果是偶数,那情感就没有反转,还是*1。在这句话里面,可以看出”好“前面只有一个”不“,所以”好“的情感值应该反转,*-1。

因此这句话的准确情感分值是:4*1+1*2-1*4-2+1*-1 = -1

⑤ 积极和消极分开来

再接下来,很明显就可以看出,这句话里面有褒有贬,不能用一个分值来表示它的情感倾向。而且这个权值的设置也会影响最终的情感分值,敏感度太高了。因此对这句话的最终的正确的处理,是得出这句话的一个积极分值,一个消极分值(这样消极分值也是正数,无需使用负数了)。它们同时代表了这句话的情感倾向。所以这句评论应该是”积极分值:6,消极分值:7“

⑥ 以分句的情感为基础

再仔细一步,详细一点,一条评论的情感分值是由不同的分句加起来的,因此要得到一条评论

Python中引入情感词典可以通过以下步骤进行: 1. 下载情感词典:首先,你需要找到一个适合你需求的情感词典。可以在网上搜索并下载一个情感词典的文本文件,或者使用已有的开源情感词典。 2. 读取情感词典使用Python的文件操作功能,打开并读取情感词典文件。可以使用`open()`函数打开文件,并使用`readlines()`函数逐行读取文件内容。 3. 解析情感词典:根据情感词典的格式,解析每一行的内容,提取情感和对应的情感极性(如正面、负面、中性等)。 4. 构建情感词典:将解析得到的情感情感极性存储到一个数据结构中,如字典或列表。可以使用字典来存储情感和对应的极性,其中情感作为键,极性作为值。 5. 使用情感词典:在需要进行情感分析的文本中,遍历每个语,并查找它是否在情感词典中存在。如果存在,则根据对应的极性进行情感计算或分类。 下面是一个示例代码,演示了如何引入情感词典进行简单的情感分析: ```python # 1. 下载情感词典并保存为emotion_dict.txt # 2. 读取情感词典 emotion_dict = {} with open('emotion_dict.txt', 'r', encoding='utf-8') as f: lines = f.readlines() for line in lines: word, polarity = line.strip().split('\t') emotion_dict[word] = polarity # 3. 使用情感词典进行情感分析 def analyze_sentiment(text): words = text.split() sentiment_score = 0 for word in words: if word in emotion_dict: polarity = emotion_dict[word] if polarity == 'positive': sentiment_score += 1 elif polarity == 'negative': sentiment_score -= 1 if sentiment_score > 0: return 'positive' elif sentiment_score < 0: return 'negative' else: return 'neutral' # 示例使用 text = "这部电影真的很棒!" sentiment = analyze_sentiment(text) print(sentiment) # 输出:positive ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值