基于词库和语法规则的情感识别方法——vader

最新推荐文章于 2025-04-14 11:32:44 发布

小白Melody

最新推荐文章于 2025-04-14 11:32:44 发布

阅读量2.5k

点赞数 4

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_42468092/article/details/116612289

版权

机器学习专栏收录该内容

6 篇文章

订阅专栏

背景

vader是一种基于词库和语法规则的情感识别方法，发布于2014年AAAI会议。
与基于模型的情感识别方法不同的是，vader是通过人工标记情感词。（含7000+个情感词，情感等级范围为-4—+4。此外还包括颜文字，如（：））以及缩写词）。vader还对标点、大小写、程度副词、连词以及否定词比较敏感。

与传统情感识别方法的区别

相较传统的词袋模型（忽略词序和语法，仅仅将文本看做是一个词集合）能够更为准确的体现句子的真实语义。
相较于基于模型的情感识别方法，vader具有更好的泛化能力，在多种数据上均具有较好的分类性能。

缺点

vader所做的情感词标记等只是针对于英文来做的，对于中文并不友好，不能直接使用，需要先进行翻译，然后才能使用。

实现方式

from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
import re
import sys
from translate import Translator

url_google = 'http://translate.google.cn'
reg_text = re.compile(r'(?<=TRANSLATED_TEXT=).*?;')
user_agent = r'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ' \
             r'Chrome/44.0.2403.157 Safari/537.36'
             
def translate_cn_api(content):
 translator= Translator(to_lang="zh")
 translation = translator.translate(content)
 return translation

def translate_en_api(content):
 translator= Translator(to_lang="en",from_lang='zh')
 translation = translator.translate(content)
 return translation

def print_sentiment_scores(tweets):
    analyser = SentimentIntensityAnalyzer()
    vadersenti = analyser.polarity_scores(tweets)
    return vadersenti['compound']

def main(question):
	#英文翻译
    questionEn = translate_en_api(question)
    print("问题英文版：", questionEn)
    #情感评分
    result = print_sentiment_scores(questionEn)
    #将情感评分-1至1的区间转换到0-1的区间。
    X_scale = (1 + result) / 2.0
    print("情感评分：", X_scale)
 
 if __name__ == '__main__':
 	question=input("请输入你的问题：")
 	print("问题中文版：", question)
    main(question)

效果图

在这里插入图片描述