2021-11-12

最新推荐文章于 2023-11-14 21:33:23 发布

weixin_46258180

最新推荐文章于 2023-11-14 21:33:23 发布

阅读量694

点赞数 2

本文链接：https://blog.csdn.net/weixin_46258180/article/details/121298222

版权

jieba 词频统计《水浒传》人物分析 Python

关键词由CSDN通过智能技术生成

一、实验目的和要求

导入jieba库
2）掌握jieba库中lcut方法
二、实验内容
程序1：使用词频统计的方法，生成《水浒传》出场次数最多的5个人物的姓名。
读取《水浒传》文本文件见附录：threekingdoms.txt
注意：词频分析到人物分析的转换

第一次做种词频统计类的题简要思路就是首先对文本进行处理然后进行分割成一个一个的列表，紧接着对列表进行判断，如果列表中的词是我们设定的那些动词就跳过他，如果列表长度大于1（目的是取出单个字或符号在这里的单个字默认不是人名）我们就把他进行次数统计，结果输出那些最多的前5名。
注：设定的词是我们通过统计出来次数很多却不是人名的词。

from collections import Counter
b=[]
exincludes = ['将军', '却说']
with open("threekingdoms.txt ",encoding="utf-8") as f:
    test=f.read()
    a=jieba.lcut(test, cut_all=False)
    for i in a:
        if i in exincludes:
            continue
        if len(i) > 1 :
            b.append(i)
    wordcount = Counter(b)
    print(wordcount.most_common(5))

// An highlighted block
var foo = 'bar';

在这里插入图片描述

weixin_46258180

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
2021-11-12

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入一、实验目的和要求导入jieba库2）掌握jieba库中lcut方法二、实验内容程序1：使用词频统计的方法，生成《
复制链接

扫一扫