小说情感分析器(基于词典)

本文介绍了一个基于Python的情感分析器,利用知网词典对小说(以花千骨为例)进行情感分析,生成句级情感系数CSV文件,并提及后续使用R语言的ggplot2进行数据可视化。
摘要由CSDN通过智能技术生成

小说情感分析器(基于词典)

作为自然语言处理学习的第一站,我选择情感分析作为起步,这里用python编写了一个简单的基于知网词典的情感分析器,并用R语言的ggplot2进行作图(ps:好看)


python代码块

导入:词典和需要分析的txt文件
pathMainText:待分析文件的路径
pathLevelList:情感程度词典路径
pathGood:正面情感词典路径
pathBad:负面情感词典路径
pathSave:csv文件的存储路径
产出:以句为单位的情感系数csv文件

def novelSentimentCsv(pathMainText,pathLevelList,pathGood,pathBad,pathSave):
    #数据获取与清洗
    import re
    #读取小说TXT
    filehqg = open(pathMainText,'r')
    lineshqg = filehqg.readlines()

    #连续字符串sumStr
    sumStr = ''
    for line in lineshqg:
        sumStr = sumStr + line
    filehqg.close()

    #中文分句方法
    # coding: utf-8 

    #设置分句的标志符号;可以根据实际需要进行修改
    cutlist ="。!?"

    #检查某字符是否分句标志符号的函数;如果是,返回True,否则返回False
    def FindToken(cutlist, char
  • 2
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值