python中文字符个数jieba_Python基于jieba的中文词云

这篇博客介绍了如何使用Python的jieba模块和wordcloud库生成中文词云。首先展示了基本的词云生成,然后引入背景图和自定义分词,通过jieba对中文文本进行分词和停用词过滤,最终生成具有代表性的三国文本词云图。
摘要由CSDN通过智能技术生成

今日学习了python的词云技术

from os import path

from wordcloud import WordCloud

import matplotlib.pyplot as plt

d=path.dirname(__file__)

text=open(path.join(d,"data//constitution.txt")).read()

# 步骤3-2:设置一张词云图对象

wordcloud = WordCloud(background_color="white", max_font_size=40).generate(text)

# 步骤4-1:创建一个图表画布

plt.figure()

# 步骤4-2:设置图片

plt.imshow(wordcloud, interpolation="bilinear")

# 步骤4-3:取消图表x、y轴

plt.axis("off")

# 显示图片

plt.show()

结果如下:这是没有背景图的词云

7aa5c78f116c6550d1b46258449fdcdc.png

接下来这个是爱丽丝漫游小说的词云

from os import path

from PIL import Image

import numpy as np

from wordcloud import WordCloud

import matplotlib.pyplot as plt

d=path.dirname(__file__)

text=open(path.join(d,"data//alice.txt")).read()

alice_mask = np.array(Image.open(path.join(d, "data/alice_mask.png")))

wordcloud=WordCloud(background_color="white",max_words=2000,mask=alice_mask)

wordcloud.generate(text)

wordcloud.to_file(path.join(d,"images//alice_word.png"))

用英文做词云很简单,不需要很麻烦的分词技术,用wordclo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值