python 词云图 WordCloud

一、结果预示

在这里插入图片描述

二、制作过程

2.1 图片准备

  • 准备一张背景白色的图片
    在这里插入图片描述

2.2 数据准备

import akshare as ak
covid_19_163_df = ak.covid_19_163(indicator="实时资讯新闻播报")

在这里插入图片描述

2.3 数据处理

  • 获取标题中文文字
import re

title = "".join(covid_19_163_df.title.tolist())      # 获取标题文字
text = "".join(re.findall('[\u4e00-\u9fa5]', title)) #匹配中文

在这里插入图片描述

  • jieba 分词处理:含去掉自定义词语、新增自定义词语
import jieba

drop_words = ['你','不'] # 去掉的词语
for word in drop_words:
    jieba.del_word(word)

jieba.add_word('社会面') # 添加自定义词语

seg_list = ",".join(jieba.cut(text,cut_all=False,HMM=True)) # 精确模式,HMM参数设置为True,可以识别新词,即词典中不存在的词。
# seg_list = ",".join(jieba.cut(text,cut_all=True,HMM=True)) # 全模式
# seg_list = ",".join(jieba.cut_for_search(text, HMM=True)) # 搜索引擎模式

在这里插入图片描述

三、绘制词云图

import numpy as np
from wordcloud import WordCloud
from PIL import Image

mask = np.array(Image.open("小鸟.png"))  # 读取背景图片

# 绘制词云图
wordcloud = WordCloud(
    font_path="C:\\Windows\\Fonts\\simsun.ttc", # 字体路径, simsun
    background_color="black",                   # 背景颜色,"black"或"white"
    width = 800,
    height = 600,
    max_words = 100,    # 显示最多的词数量
    max_font_size = 80, # 显示的最大的字体大小
    mask = mask,
    collocations=False # 是否包括两个词的搭配
).generate(seg_list)

# 生成词云图文件
wordcloud.to_file('词云图_小鸟.png')

在这里插入图片描述

四、完整代码

import re
import jieba
import numpy as np
from wordcloud import WordCloud
from PIL import Image

import akshare as ak

covid_19_163_df = ak.covid_19_163(indicator="实时资讯新闻播报")

title = "".join(covid_19_163_df.title.tolist())      # 获取标题文字
text = "".join(re.findall('[\u4e00-\u9fa5]', title)) #匹配中文

drop_words = ['你','不'] # 去掉的词语
for word in drop_words:
    jieba.del_word(word)

jieba.add_word('社会面') # 添加自定义词语

seg_list = ",".join(jieba.cut(text,cut_all=False,HMM=True)) # 精确模式,HMM参数设置为True,可以识别新词,即词典中不存在的词。
# seg_list = ",".join(jieba.cut(text,cut_all=True,HMM=True)) # 全模式
# seg_list = ",".join(jieba.cut_for_search(text, HMM=True)) # 搜索引擎模式

mask = np.array(Image.open("小鸟.png"))  # 读取背景图片

# 绘制词云图
wordcloud = WordCloud(
    font_path="C:\\Windows\\Fonts\\simsun.ttc", # 字体路径, simsun
    background_color="black",                   # 背景颜色,"black"或"white"
    width = 800,
    height = 600,
    max_words = 100,    # 显示最多的词数量
    max_font_size = 80, # 显示的最大的字体大小
    mask = mask,
    collocations=False # 是否包括两个词的搭配
).generate(seg_list)

# 生成词云图文件
wordcloud.to_file('词云图_小鸟.png')
  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值