Python第三方库之jieba和wordcloud的使用——计算文章词频以及生成词云

本文介绍了如何利用Python的jieba库进行文本分词,并结合wordcloud库生成词云。通过示例展示了如何统计《三国演义》中的人物频率,以及创建不同形状的词云,如方形和爱心形。
摘要由CSDN通过智能技术生成

jieba库

主要函数:

在这里插入图片描述
示例:三国演义人物频率统计(粗略版)

# -*- coding: utf-8 -*-
import jieba

excludes = {
   "来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此","如何","天下",\
            "商议","于是","今日","不敢","引兵","次日","军马","军士","主公","大喜","东吴","魏兵",\
            "陛下","都督"}
f = open("/Users/lilhoe/Downloads/jieba和wordcloud库使用的文档/三国演义.txt", "r", encoding="gbk")
txt = f.read()
f.close()
words = jieba.lc
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值