在Python中生成词云

利用jieba、wordcloud、matplotlib三个库做出词云

基本步骤

  • 1、将目标文本分词
  • 2、创建词云对象
  • 3、生成图片

解释

  • WordCloud是可以分词的,但是对中文不友好,所以需要使用jieba库分词
    分词教程
  • 词云对象需要指定字体的路径,默认字体无法显示中文文本
WordCloud参数说明
width词云图片的宽度
height词云图片的高度
min_font_size最小字号,默认是4号
max_font_size最大字号
font_step字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
font_path字体路径
max_words最大单词数量,默认200个
stop_words忽略的单词列表
background_color词云图片的背景色
mask指定词云形状,图片的白色部分不显示词语,其余颜色将会显示词语

最简单的词云

import jieba
import matplotlib.pyplot as plt 
from wordcloud import WordCloud, ImageColorGenerator
text = '从语体的角度看,立法语体相对独立,法律文本的词语特征、句子特征和篇章特征都体现了这种相对独立性。'
cut_text = '|'.join(jieba.cut(text, cut_all=False))
wordcloud = WordCloud(
 font_path="C:/Windows/Fonts/simfang.ttf",
 background_color="white",
 width=1000,
 height=880,
 ).generate(cut_text)
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

在这里插入图片描述

拓展

如果生成特殊图形的词云(默认是方形),则加以下代码即可,注意图片的白色不显示文字

import wordcloud
import numpy as np
import matplotlib.pyplot as plt
import PIL
import jieba

content=open("content.txt","r").read()          #读取文本文件
cut_list=jieba.cut(content)                     #分词
target_content=" ".join(cut_list)               #将列表转为字符串,并以空格隔开
image = PIL.Image.open(r'pic.png')              #加载图片
MASK = np.array(image)                          #将图片转化为数组
#设置词云对象
WC = wordcloud.WordCloud(                       
    font_path = r'C:\Windows\Fonts\msyh.ttc',   #微软雅黑字体路径 ‪C:\Windows\Fonts\msyh.ttc‬
    max_words=2000,
    mask = MASK,
    height= 1000,
    width=1000,
    background_color='white',
    repeat=False,
    mode='RGBA'
    )
#生成词云图片
wc_image = WC.generate(target_content)
plt.imshow(wc_image)
plt.axis('off')
plt.show()

在这里插入图片描述

参考文献

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序鸡

如果帮到您,点个赞鼓励一下吧。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值