利用Matplotlib绘制词云_Python数据分析与可视化

利用Matplotlib绘制词云

词云对于网络文本中出现频率较多的关键词予以视觉上额突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

安装相关的包

绘制词云安装两个包,WordCloud包和jieba包。
jieba包的作用是从句子中分割词汇。

pip install wordcloud
pip install jieba

在这里插入图片描述
在这里插入图片描述

词云生成过程

一般生成词云的过程为:

  1. 首先使用pandas读取数据并将需要分析的数据转化为列表;
  2. 对获得的列表数据利用分词工具jieba进行遍历分词;
  3. 使用WordCloud设置词云图片的属性、掩码和停用词,并生成词云图像。

示例

import jieba
from wordcloud import WordCloud,STOPWORDS
import PIL.Image as image
import numpy as np
import matplotlib.pyplot as plt

def get_wordCloud():
	# 读取文件的时候记得查看文件的编码方式,在记事本的右下角(具体位置见文末图)
    file = open("data//背影.txt", encoding='utf-8')
    mylist = file.read()
    word_list = jieba.cut(mylist)
    new_text = ''.join(word_list)
    # 加入背景形状
    pic_path = 'data//myimg.jpg'
    img_mask = np.array(image.open(pic_path))
    # 停用词库,英文文本的停用词直接用 stopwords = STOPWORDS
    # 中文停用需要导入替换
    stopwords = set()
    # 读取文件的时候记得查看文件的编码方式,在记事本的右下角(具体位置见文末图)
    content = [line.strip() for line in open('data//泰戈尔的诗.txt','r', encoding='ANSI').readlines()]
    stopwords.update(content)
    # 生成词云
    wordcloud = WordCloud(background_color = "white",font_path = 'C:\windows\Fonts\msyh.ttc', mask = img_mask,stopwords = stopwords).generate(new_text)
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()
wordList = get_wordCloud()

在这里插入图片描述

全部:
在这里插入图片描述

文件编码:
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿松爱睡觉

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值