python3---情感分析(基于词典中文)

本文介绍了Python3中使用词典进行情感分析的基础方法,包括使用台湾大学NTUSD简体中文情感词典等资源。文章提供词典下载链接,并分享了简单的规则和代码实现,适用于初步处理文本数据的情感分析。作者欢迎批评指教,期待更好的分析技巧分享。
摘要由CSDN通过智能技术生成

写在前面:
现有的情感分析比较常用的有两种,分别是基于词典的和机器学习,前者也属于非监督学习,后者自然一般属于监督学习。

刚开始学情感分析,下面先从**【基于词典的情感分析】**开始进行:

  • 词典:我东搜西找找到了一些感觉是常用的字典,主要有(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,BosonNLP_sentiment_score,知网hownet2007)

  • 词典下载传送门
    (积fen少的学生党可以评论留言【年级+邮箱】,看到会发送滴)

  • 因为刚学,所以设计了一些比较基础的规则(基于文本预处理之后生成了关于每一个文档的【词列表向量】)
    在这里插入图片描述
    代码实现:

  • 加载词典(我主要用的是NTUSD的中文情感极性词典):

#定义一个函数加载词典
def dict_load(path):
    dict=[]
    with open(path, encoding='utf-8-sig') as f:
        for line in f:
            if line.strip() !='':#养成去空好习惯
                dict.append(line.strip())
    return(dict)

#开始加载情感词典列表
neg_dict = [] #消极情感词典
pos_dict = [] #积极情感词典
no_dict = [] #否定词词典
dict_file_path='XXXXXX\\'#词典位置,根据需要修改,注意转义符啥的!!!
pos_dict=dict_load(dict_file_path+'台湾大学NTUSD简体中文情感词典/ntusd-positive.txt')
#print(pos_dict)
print("==pos_dict loaded successfully==")
neg_dict=dict_load(dict_file_path+'台湾大学NTUSD简体中文情感词典/ntusd-negative.txt')
#print(neg_dict)
print("==neg_dict loaded successfully==")
no_dict=dict_load(dict_file_path+'否定词典\\否定.txt')
#print(no_dict)
print("==no
情感分析是一种通过计算机自动分析文本中的情感倾向的技术。基于情感词典情感分析方法使用一个情感词典来识别文本中的情感词,并根据这些词的情感极性和程度来计算整个文本的情感倾向。 Python是一种流行的编程语言,非常适合用来实现情感分析算法。在csdn上可以找到很多关于基于情感词典Python情感分析的教程和代码示例。 实现基于情感词典情感分析的主要步骤如下: 1. 准备情感词典:首先,需要准备一个情感词典,其中包含了一系列的情感词和它们的情感极性(如正向或负向)。 2. 预处理文本:对待分析的文本进行预处理,包括去除标点符号、分词等操作,使得文本更适合进行情感分析。 3. 计算情感得分:遍历文本中的每个词,如果该词在情感词典中出现,则根据其情感极性和程度进行计分。可以使用加权算法,根据词语在文本中的频率和在情感词典中的情感得分来计算整个文本的情感得分。 4. 判断情感倾向:根据文本的情感得分,可以判断其情感倾向,如积极、消极或中性。 在csdn上可以找到很多用Python实现基于情感词典情感分析的代码示例。这些示例中包含了准备情感词典、预处理文本、计算情感得分和判断情感倾向的具体实现方法。通过学习和尝试这些代码示例,我们可以了解和掌握基于情感词典情感分析方法,并借助Python编程技术来实现自己的情感分析应用。
评论 66
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值