python学习2019/06/01

wordcloud库的使用

wordcloud.WordCloud()代表一个文本对应的词云
可以根据文本中词语出现的频率等参数绘制词云
绘制词云的形状、尺寸和颜色都可以设定

w = wordclooud。WordCloud()
以wordcloud对象为基础
配置参数、加载文本、输出文件

w。generate(txt)
向wordcloud对象w中加载文本txt,
w。generate(‘python and wordcloud’)

w。to_file(filename)
将词云输出为图像文件
。png,或。jpg格式
w。to_file(‘outfile。png’)

1,配置对象参数
2,加载词云文本
3,输出词云文件

import wordcloud
c = wordcloud.WordCloud()
c.generate(‘wordcloud by python’)
1,分隔,以空格分隔单词
2,统计,单词出现次数并过滤
3,字体,根据统计配置字号
4,布局,颜色环境尺寸
c.to_file(‘pywordcloud.png’)

w = wordcloud.WordCloud(<参数>)

wight
指定词云生成图片的宽度,默认400像素
w = wordclod。WordCloud(wight=600)

height
指定词云生成图片的高度,默认200像素
w = wordcloud。WordCloud(height=400)

min_font_size
指定词云中字体的最小字号,默认4号
w = wordclod。WordCloud(min_font_size=10)

max_font_size
指定词云中字体的最大字号,根据高度自动调节
w = wordcloud.WordCloud(max_font_size=20)

font_step
指定词云中字体字号的步进间隔,默认为1
w = wordcloud.WordCloud(font_step=2)

font_path
指定字体文件的路径,默认为None
w = wordcloud.WordCloud(font_path=‘msyh.ttc’)
显示的字体

max_words
显示词云显示的最大单词数量,默认为200
w = wordcloud.WordCloud(max_words=20)

stop_words
指定词云的排除词列表,即不显示的单词列表
w = wordcloud.WordCloud(stop_words={‘python’})

mask
指定词云形状,默认为长方形,需要引用imread()函数
from scipy.misc importimread
mk = imread(‘pic.png’)
w = wordcloud.WordCloud(mask=mk)

background_color
指定词云的背景颜色,默认为黑色
w = wordcloud.WordCloud(background_color=‘white’)

import jieba
import wordcloud
from imageio import imread
#使用函数jieba,wordcloud,imread
mask = imread(‘fivestar.jpg’)
#读取图片文件赋值给mask
f = open(‘新时代中国特色社会主义.txt’,‘r’,encoding=‘utf-8’)
#打开文件
t = f.read()
#t = 读取文件内容
f.close()
#关闭f文件
ls = jieba.lcut(t)
#用jieba库对t,读取的文件内容进行分词,提取到列表ls
txt = ’ '.join(ls)
#在ls列表中对每个词之间加入空格,赋值给txt
w = wordcloud.WordCloud(font_path=‘msyh.ttc’, mask=mask,
width=1000, height=700, background_color=‘white’)
#对wordcloud进行参数调整,字体,形状,宽度,高度,背景色,最多单词。
w.generate(txt)
w.to_file(‘pywordcloud4.1.png’)

import jieba
import wordcloud
from imageio import imread
#使用函数jieba,wordcloud,imread
mask = imread(‘123.jpg’)
f = open(‘关于实施乡村振兴战略的意见.txt’,‘r’,encoding=‘utf-8’)
#打开文件
t = f.read()
#t = 读取文件内容
f.close()
#关闭f文件
ls = jieba.lcut(t)
#用jieba库对t,读取的文件内容进行分词,提取到列表ls
txt = ’ '.join(ls)
#在ls列表中对每个词之间加入空格,赋值给txt
w = wordcloud.WordCloud(font_path=‘msyh.ttc’, mask=mask,
width=1000, height=700, background_color=‘white’)
w.generate(txt)
w.to_file(‘pywordcloud5.png’)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值