python学习2019/06/01

最新推荐文章于 2022-03-13 15:05:18 发布

为什么我会那么逗

最新推荐文章于 2022-03-13 15:05:18 发布

阅读量190

点赞数

本文链接：https://blog.csdn.net/xtbsl/article/details/90735806

版权

wordcloud库的使用

wordcloud.WordCloud()代表一个文本对应的词云
可以根据文本中词语出现的频率等参数绘制词云
绘制词云的形状、尺寸和颜色都可以设定

w = wordclooud。WordCloud（）
以wordcloud对象为基础
配置参数、加载文本、输出文件

w。generate（txt）
向wordcloud对象w中加载文本txt，
w。generate（‘python and wordcloud’）

w。to_file（filename）
将词云输出为图像文件
。png，或。jpg格式
w。to_file（‘outfile。png’）

1，配置对象参数
2，加载词云文本
3，输出词云文件

import wordcloud
c = wordcloud.WordCloud()
c.generate(‘wordcloud by python’)
1，分隔，以空格分隔单词
2，统计，单词出现次数并过滤
3，字体，根据统计配置字号
4，布局，颜色环境尺寸
c.to_file(‘pywordcloud.png’)

w = wordcloud.WordCloud(<参数>)

wight
指定词云生成图片的宽度，默认400像素
w = wordclod。WordCloud（wight=600）

height
指定词云生成图片的高度，默认200像素
w = wordcloud。WordCloud（height=400）

min_font_size
指定词云中字体的最小字号，默认4号
w = wordclod。WordCloud（min_font_size=10）

max_font_size
指定词云中字体的最大字号，根据高度自动调节
w = wordcloud.WordCloud(max_font_size=20)

font_step
指定词云中字体字号的步进间隔，默认为1
w = wordcloud.WordCloud(font_step=2)

font_path
指定字体文件的路径，默认为None
w = wordcloud.WordCloud(font_path=‘msyh.ttc’)
显示的字体

max_words
显示词云显示的最大单词数量，默认为200
w = wordcloud.WordCloud(max_words=20)

stop_words
指定词云的排除词列表，即不显示的单词列表
w = wordcloud.WordCloud(stop_words={‘python’})

mask
指定词云形状，默认为长方形，需要引用imread（）函数
from scipy.misc importimread
mk = imread(‘pic.png’)
w = wordcloud.WordCloud(mask=mk)

background_color
指定词云的背景颜色，默认为黑色
w = wordcloud.WordCloud(background_color=‘white’)

import jieba
import wordcloud
from imageio import imread
#使用函数jieba，wordcloud，imread
mask = imread(‘fivestar.jpg’)
#读取图片文件赋值给mask
f = open(‘新时代中国特色社会主义.txt’,‘r’,encoding=‘utf-8’)
#打开文件
t = f.read()
#t = 读取文件内容
f.close()
#关闭f文件
ls = jieba.lcut(t)
#用jieba库对t，读取的文件内容进行分词，提取到列表ls
txt = ’ '.join(ls)
#在ls列表中对每个词之间加入空格，赋值给txt
w = wordcloud.WordCloud(font_path=‘msyh.ttc’, mask=mask,
width=1000, height=700, background_color=‘white’)
#对wordcloud进行参数调整，字体，形状，宽度，高度，背景色，最多单词。
w.generate(txt)
w.to_file(‘pywordcloud4.1.png’)

import jieba
import wordcloud
from imageio import imread
#使用函数jieba，wordcloud，imread
mask = imread(‘123.jpg’)
f = open(‘关于实施乡村振兴战略的意见.txt’,‘r’,encoding=‘utf-8’)
#打开文件
t = f.read()
#t = 读取文件内容
f.close()
#关闭f文件
ls = jieba.lcut(t)
#用jieba库对t，读取的文件内容进行分词，提取到列表ls
txt = ’ '.join(ls)
#在ls列表中对每个词之间加入空格，赋值给txt
w = wordcloud.WordCloud(font_path=‘msyh.ttc’, mask=mask,
width=1000, height=700, background_color=‘white’)
w.generate(txt)
w.to_file(‘pywordcloud5.png’)