基于词库和语法规则的情感识别方法——vader

背景

    vader是一种基于词库和语法规则的情感识别方法,发布于2014年AAAI会议。
    与基于模型的情感识别方法不同的是,vader是通过人工标记情感词。(含7000+个情感词,情感等级范围为-4—+4。此外还包括颜文字,如(:))以及缩写词)。vader还对标点、大小写、程度副词、连词以及否定词比较敏感。

与传统情感识别方法的区别

    相较传统的词袋模型(忽略词序和语法,仅仅将文本看做是一个词集合)能够更为准确的体现句子的真实语义。
    相较于基于模型的情感识别方法,vader具有更好的泛化能力,在多种数据上均具有较好的分类性能。

缺点

    vader所做的情感词标记等只是针对于英文来做的,对于中文并不友好,不能直接使用,需要先进行翻译,然后才能使用。

实现方式

from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
import re
import sys
from translate import Translator

url_google = 'http://translate.google.cn'
reg_text = re.compile(r'(?<=TRANSLATED_TEXT=).*?;')
user_agent = r'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ' \
             r'Chrome/44.0.2403.157 Safari/537.36'
             
def translate_cn_api(content):
 translator= Translator(to_lang="zh")
 translation = translator.translate(content)
 return translation

def translate_en_api(content):
 translator= Translator(to_lang="en",from_lang='zh')
 translation = translator.translate(content)
 return translation

def print_sentiment_scores(tweets):
    analyser = SentimentIntensityAnalyzer()
    vadersenti = analyser.polarity_scores(tweets)
    return vadersenti['compound']

def main(question):
	#英文翻译
    questionEn = translate_en_api(question)
    print("问题英文版:", questionEn)
    #情感评分
    result = print_sentiment_scores(questionEn)
    #将情感评分-1至1的区间转换到0-1的区间。
    X_scale = (1 + result) / 2.0
    print("情感评分:", X_scale)
 
 if __name__ == '__main__':
 	question=input("请输入你的问题:")
 	print("问题中文版:", question)
    main(question)

效果图

在这里插入图片描述

  • 4
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
古诗词情感分析是一种利用自然语言处理技术,对古代文学作品进行情感倾向性分析的方法。Python是一种流行的编程语言,拥有丰富的自然语言处理工具。下面介绍一种基于Python的古诗词情感分析方法。 1. 数据收集:选择一些古代诗词作为分析对象,并将其保存在文本文件中。 2. 数据预处理:使用Python的NLTK工具包进行分词、去停用词等预处理操作。 3. 情感词典构建:构建一个情感词典,包含一些正面情感词、负面情感词和中性情感词。 4. 情感分析:对每个诗句进行情感分析,计算其中包含的情感词的得分,并根据得分判断诗句的情感倾向性。 5. 结果展示:将分析结果以图表或文字的形式呈现出来,以便观察。 下面是一个简单的Python代码示例,演示了如何进行古诗词情感分析: ```python import nltk from nltk.tokenize import word_tokenize from nltk.corpus import stopwords from nltk.sentiment.vader import SentimentIntensityAnalyzer # 加载情感词典 sia = SentimentIntensityAnalyzer() # 加载停用词 stop_words = set(stopwords.words('chinese')) # 打开文本文件并读取内容 with open('poetry.txt', 'r', encoding='utf-8') as f: text = f.read() # 分词 tokens = word_tokenize(text) # 去停用词 filtered_tokens = [token for token in tokens if token not in stop_words] # 计算情感得分 scores = [] for token in filtered_tokens: score = sia.polarity_scores(token) scores.append(score['compound']) # 计算平均得分 avg_score = sum(scores) / len(scores) # 输出结果 if avg_score > 0: print('这首诗是积极的') elif avg_score < 0: print('这首诗是消极的') else: print('这首诗是中性的') ``` 该代码使用NLTK工具包进行分词和去停用词操作,使用VADER情感分析器计算每个词的情感得分,并计算所有词的平均得分。最后,根据平均得分的正负性,判断诗句的情感倾向性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值