wordcloud python_python模块之wordcloud

wordcloud官方文档:

英文直接用wordcloud就可以,如果是中文需要进行分词,我用了jieba分词,jieba分词处理中文可参考:https://github.com/fxsjy/jieba

实例:

from wordcloud import WordCloud

%matplotlib inline

import matplotlib.pyplot as plt

with open("wordcloud_en.txt","r") as f:

text = f.read()

wc = WordCloud() #生成词云对象

wc.generate(text) #将text添加到词云中

# print(wc.words_) #分词处理,统计词频

wc.to_file("wc.jpg") #词云统计成图片,保存到当前目录

plt.imshow(wc) #直接绘制到窗口上,和wc.jpg存图一致

plt.axis("off") #关闭坐标系

执行结果:

词云定制相关

from PIL import Image

import numpy as np

text_dict = {'Mom': 1.0, 'said': 0.7, 'take': 0.6, 'run rain': 0.6, 'time': 0.5, 'away': 0.5, 'rain': 0.3, 'stood': 0.3, 'day': 0.3, 'washing': 0.3, 'memories': 0.3, 'child': 0.3, 'young': 0.3, 'wet': 0.3, 'shopping': 0.2, 'Wal': 0.2, 'Mart': 0.2, 'pouring': 0.2, 'waited': 0.2, 'repeated': 0.2, 'honey': 0.2, 'minute': 0.2, 'soaked': 0.2, 'morning': 0.2, 'say': 0.2, 'us': 0.2, 'anything': 0.2, 'one': 0.2, 'moment': 0.2, 'needed': 0.2, 'ran': 0.2, 'cars': 0.2, 'got': 0.2, 'make': 0.2, 'every': 0.2, 'heaven': 0.2, 'must': 0.1, 'years': 0.1, 'old': 0.1, 'beautiful': 0.1, 'brown': 0.1, 'haired': 0.1, 'freckle': 0.1, 'faced': 0.1, 'image': 0.1, 'innocence': 0.1, 'outside': 0.1, 'kind': 0.1, 'gushes': 0.1, 'top': 0.1, 'gutters': 0.1, 'much': 0.1, 'hurry': 1, 'hit': 0.1, 'Earth': 3, 'flow': 4, 'spout': 0.1, 'awning': 0.1, 'inside': 0.1}

mask = np.array(Image.open("cat.jpg")) #打开图片并转换成数组类型

# wc2 = WordCloud(background_color="white",max_words=15,mask=mask) #背景颜色白色,最大词数是15,模板是mask

wc2 = WordCloud(background_color="white",mask=mask) #背景颜色白色,模板是mask

wc2.generate_from_frequencies(text_dict) #字典类型的对象,所以用generate_from_frequencies

plt.imshow(wc2)

plt.axis("off")

执行结果:

中文转换为词云

import jieba #使用该模块中的中文分词

with open("wordcloud_cn.txt","r") as f:

text = f.read()

# print(text)

# seg_list = jieba.cut(text,cut_all=True) #全模式切割,生成一个生成器对象

seg_list = jieba.cut(text,cut_all=False) #精确式切割,生成一个生成器对象,也可不添加cut_all,默认为False

example = "".join(seg_list) #将对象通过join连接

# print(example)

wc3 = WordCloud(font_path=r"C:\Windows\Fonts\simsun.ttc") #中文要指定字体

wc3.generate(example)

plt.imshow(wc3)

plt.axis("off")

执行结果:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: font_path是Pythonwordcloud模块中的一个参数,用于指定生成词云图时所使用的字体文件路径。通过设置font_path参数,可以让生成的词云图使用指定的字体,从而让词云图更加美观和个性化。在使用wordcloud模块生成词云图时,我们可以根据自己的需求选择合适的字体文件,并将其路径传递给font_path参数即可。 ### 回答2: Python中的wordcloud库是一个用于生成词云图的库,它能够根据输入文本中不同词汇出现的频率大小和重要性,生成相应的词云图。 在wordcloud库中,font_path是一个用于设置字体路径的参数,它可以指定生成的词云图中所使用的字体类型。由于在生成词云图时需要显示文本,因此生成的词云图所使用的字体类型对于词云图的整体效果有着非常大的影响。如果选用不合适的字体类型,就可能导致词云图的显示效果不佳。 在使用font_path参数时,我们需要指定一个字体文件的路径,以供词云图生成器调用。需要注意的是,如果在您的系统中没有安装相应的字体文件,则需要先下载并安装相应的字体文件。 在一般情况下,我们可以通过如下代码指定字体路径: ```python from wordcloud import WordCloud wc = WordCloud(font_path='path/to/font/file.ttf') ``` 当然,在指定字体路径之前,我们还需要导入相应的库,如上述代码中我们导入了wordcloud库,并将其别名为wc,然后在定义对象时,指定了所使用的字体文件路径,并将其赋给font_path参数。 总之,在使用wordcloud库生成词云图时,正确设置font_path参数是非常重要的,它直接关系到词云图的显示效果。需要根据个人需求,选择合适的字体类型,并准备好对应的字体文件路径,再进行调用即可。 ### 回答3: 在Python中使用wordcloud进行词云生成时,font_path是一个非常重要的参数。简单来说,font_path指的是用于生成词云的字体文件的路径。因为词云是由文本中的词语绘制而成的,而字体是词语的外表现,字体的不同会直接影响词云的呈现效果。 在Python中,wordcloud字体文件的默认路径是系统字体的路径,即/System/Library/Fonts/在macOS系统下,因此如果你的macOS系统安装的是中文操作系统,那么生成的词云就是中文的。但是如果你想要改变词云的字体,可以使用font_path参数来指定自己喜欢的字体文件的路径。例如: ```python from wordcloud import WordCloud wordcloud = WordCloud(font_path="/path/to/font.ttf", background_color="white").generate(text) ``` 这里的“/path/to/font.ttf”指的是你喜欢的字体文件的路径。当然,这个路径需要根据你自己的计算机情况和字体文件的具体存放位置做出相应的修改。需要注意的是,在指定font_path时,需要保证指定的字体文件能够被wordcloud模块正确识别和加载。如果字体文件无法正确加载,wordcloud就会使用默认的字体文件进行词云生成。 所以,在使用Python中的wordcloud库时,我们需要特别关注font_path参数,这个参数决定了最终生成的词云的字体和美观程度。要想生成更漂亮的词云,就需要自己在网上搜索和下载适合自己的字体文件,然后指定路径加载。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值