python2.0词云 wordcloud+jieba中文词云图的简单案例&&详细解释代码

本文使用jieba分词和wordcloud库,通过朱自清的《春》进行词云分析。遇到中文编码问题,解决方案包括修改wordcloud源码或指定字体路径。分享人生感悟:人生要自己承受,乐观面对。
摘要由CSDN通过智能技术生成

Python中分分词工具很多,在这里选用的分词工具jieba分词,分词需要用到两个包,如下:

1、jieba:是结巴分词工具
2、wordcloud:是词云

** 选用朱自清的散文《春》进行词云分析,代码入下:**

**-*- coding: utf-8 -*-**
'''
分别导入了画图的库,词云生成库和jieba的分词库
''
import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud
#打开本体TXT文件
text=open("chun.txt").read()
#使用jieba进行分词,并对分词的结果以空格隔开,cut_all=True 设置为全模式 
wlist=jieba.cut(text,cut_all=True)
#使用空格连接 
mylist=" ".join(wlist)
#对分词后的文本生成词云
mylistt=WordCloud().generate(mylist)
#显示词云图
plt.imshow(mylistt)
#是否显示x轴、y轴下标
plt.axis("off")
plt.show()

运行结果如下:
在这里插入图片描述
如果

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以为您讲解如何使用Pythonwordcloudjieba制作中文词云图。 首先,您需要安装以下库:wordcloudjieba 和 matplotlib。您可以使用以下命令进行安装: ``` pip install wordcloud pip install jieba pip install matplotlib ``` 接着,您需要准备一段中文文本。您可以从网络上下载一些中文文章,或者自己写一些中文文本。 然后,您可以使用jieba库将中文文本进行分词。jieba库提供了一个基于前缀词典实现的中文分词器,可以将中文文本分成一个个词语。下面是一个使用jieba库进行中文分词的示例代码: ```python import jieba # 设置停用词文件路径 jieba.analyse.set_stop_words("stopwords.txt") # 读取文本文件 with open("text.txt", "r", encoding="utf-8") as f: text = f.read() # 对文本进行分词 words = jieba.cut(text) # 输出分词结果 print(",".join(words)) ``` 在上面的代码中,我们使用了一个停用词文件来过滤掉一些无意义的词语。您可以自己准备一个停用词文件,也可以使用别人已经准备好的停用词文件。 接下来,您可以使用wordcloud库生成词云图wordcloud库提供了一个WordCloud类,可以根据词语频率生成词云图。下面是一个使用wordcloud库生成词云图的示例代码: ```python import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt # 设置停用词文件路径 jieba.analyse.set_stop_words("stopwords.txt") # 读取文本文件 with open("text.txt", "r", encoding="utf-8") as f: text = f.read() # 对文本进行分词 words = jieba.cut(text) # 生成词语频率字典 word_freq = {} for word in words: if word not in word_freq: word_freq[word] = 0 word_freq[word] += 1 # 生成词云图 wc = WordCloud(font_path="simhei.ttf", background_color="white") wc.generate_from_frequencies(word_freq) # 显示词云图 plt.imshow(wc, interpolation="bilinear") plt.axis("off") plt.show() ``` 在上面的代码中,我们使用了一个字体文件来设置词云图的字体。您可以自己选择一个中文字体文件,也可以使用别人已经准备好的字体文件。 最后,您可以使用matplotlib库将词云图显示出来。使用plt.imshow()函数可以显示图像,使用plt.axis("off")函数可以去掉坐标轴,使用plt.show()函数可以显示图像。 希望以上内容能够帮助到您制作中文词云图
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值