词典法——python从母词及其扩充的情感词典txt文件读取到列表list中

情感词典的截图如下,从母词及其扩充的情感词典文件中中读取到列表中?
在这里插入图片描述
代码如下,最终结果存储在pos_dic列表中:

//列表positive_extended中每一个元素为文件中的一行内容
with open('positive_extended.txt',encoding="utf-8") as f:
    positive_extended = f.readlines()
# print(positive_extended[0:5])   
//列表temp中的每一个元素文件中每一行内容按照空格分隔得到的列表
temp=[]
for row in positive_extended:
    temp.append(row.split())    //row.split()返回值为列表
# print(temp[0:5])
//列表中pos_dic每一个元素为文件中每一个词语
pos_dic = []
for row in temp:
    for column in row:
        pos_dic.append(column)
# print(pos_dic[0:10])

将注释的代码打印出来的结果如下:

['注:每行第一个词为母词,后续为扩充词\n', '上扬 直线上扬 略微上扬 上翘 涨势 向上 走高 拉高 向下 跌势 上涨\n', '上涨 大幅上涨 持续上涨 继续上涨 涨势 小幅上涨 同步上涨 上涨幅度 走高\n', '主动 主动地 能够主动 能主动 积极主动 主动积极 不主动 学会主动 主动要求 主动接触\n', '了结 了断 一笔勾销 了却 收手 快刀斩乱麻 彻底的结束 告一段落 结束一切 未了 揭过\n']

[['注:每行第一个词为母词,后续为扩充词'], ['上扬', '直线上扬', '略微上扬', '上翘', '涨势', '向上', '走高', '拉高', '向下', '跌势', '上涨'], ['上涨', '大幅上涨', '持续上涨', '继续上涨', '涨势', '小幅上涨', '同步上涨', '上涨幅度', '走高'], ['主动', '主动地', '能够主动', '能主动', '积极主动', '主动积极', '不主动', '学会主动', '主动要求', '主动接触'], ['了结', '了断', '一笔勾销', '了却', '收手', '快刀斩乱麻', '彻底的结束', '告一段落', '结束一切', '未了', '揭过']]

['注:每行第一个词为母词,后续为扩充词', '上扬', '直线上扬', '略微上扬', '上翘', '涨势', '向上', '走高', '拉高', '向下']

将这几行代码写到函数中read_dic(dic_type):
本地词典为:
在这里插入图片描述

def read_dic(dic_type):
    with open(dic_type+'_extended.txt',encoding="utf-8") as f:
        positive_extended = f.readlines()
    # print(positive_extended[0:5])
    temp=[]
    for row in positive_extended:
        temp.append(row.split()) 
    # print(temp[0:5])
    pos_dic = []
    for row in temp:
        for column in row:
            pos_dic.append(column)
    # print(pos_dic[0:10])
    return pos_dic
print(read_dic("positive")[0:10])
print(read_dic("negative")[0:10])
print(read_dic("uncertainty")[0:10])

print(read_dic(“uncertainty”)[0:10])
设置函数形参dic_type,传入不同的形参,可以利用此函数生成六个词典的列表返回值:positive/negative/moralstrong/moralweak/litigious/uncertainty。

下文是整体过程:
写在前面:文档指的是一条记录,占一行。
下文是对情感法进行简单情感分析的过程博客,并不涉及对词语的加权、对程度副词加权和对否定词取反的操作,仅仅对词典中的词语进行计数。
输入:待计数文档,已有的六个情感词典。
输出:对六个词典中出现的词语进行计数得到的六列数据。
顺序见下:

分词并去停用词返回嵌套列表并保存到本地
https://blog.csdn.net/weixin_43919570/article/details/104316316
从母词及其扩充的情感词典txt文件读取到列表list中
https://blog.csdn.net/weixin_43919570/article/details/104311270
判断文档中的词语有多少在情感词典中并计数
https://blog.csdn.net/weixin_43919570/article/details/104312714
批量输出情感词计数结果到列表中
https://blog.csdn.net/weixin_43919570/article/details/104315090
其实4是对3加了一个循环得到的,应该将3和4看成一体,作用是输出计数列表。
词典法情感分析数词操作并输出结果到csv文件中
https://blog.csdn.net/weixin_43919570/article/details/104316043
第5篇文章是对以上四篇文章的汇总使用。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值