利用Matplotlib绘制词云_Python数据分析与可视化

最新推荐文章于 2024-05-28 17:53:37 发布

阿松爱睡觉

最新推荐文章于 2024-05-28 17:53:37 发布

阅读量241

点赞数

分类专栏： Python数据分析可视化文章标签： matplotlib python 数据分析 jupyter 数据可视化

本文链接：https://blog.csdn.net/xks18232047575/article/details/134700200

版权

Python数据分析可视化专栏收录该内容

42 篇文章 8 订阅

订阅专栏

利用Matplotlib绘制词云

安装相关的包
词云生成过程
示例

词云对于网络文本中出现频率较多的关键词予以视觉上额突出，形成“关键词云层”或“关键词渲染”，从而过滤掉大量的文本信息，使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

安装相关的包

绘制词云安装两个包，WordCloud包和jieba包。
jieba包的作用是从句子中分割词汇。

pip install wordcloud
pip install jieba

在这里插入图片描述

词云生成过程

一般生成词云的过程为：

首先使用pandas读取数据并将需要分析的数据转化为列表；
对获得的列表数据利用分词工具jieba进行遍历分词；
使用WordCloud设置词云图片的属性、掩码和停用词，并生成词云图像。

示例

import jieba
from wordcloud import WordCloud,STOPWORDS
import PIL.Image as image
import numpy as np
import matplotlib.pyplot as plt

def get_wordCloud():
	# 读取文件的时候记得查看文件的编码方式，在记事本的右下角（具体位置见文末图）
    file = open("data//背影.txt", encoding='utf-8')
    mylist = file.read()
    word_list = jieba.cut(mylist)
    new_text = ''.join(word_list)
    # 加入背景形状
    pic_path = 'data//myimg.jpg'
    img_mask = np.array(image.open(pic_path))
    # 停用词库，英文文本的停用词直接用 stopwords = STOPWORDS
    # 中文停用需要导入替换
    stopwords = set()
    # 读取文件的时候记得查看文件的编码方式，在记事本的右下角（具体位置见文末图）
    content = [line.strip() for line in open('data//泰戈尔的诗.txt','r', encoding='ANSI').readlines()]
    stopwords.update(content)
    # 生成词云
    wordcloud = WordCloud(background_color = "white",font_path = 'C:\windows\Fonts\msyh.ttc', mask = img_mask,stopwords = stopwords).generate(new_text)
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()
wordList = get_wordCloud()

在这里插入图片描述

全部：
在这里插入图片描述

文件编码：
在这里插入图片描述

阿松爱睡觉

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
利用Matplotlib绘制词云_Python数据分析与可视化

词云对于网络文本中出现频率较多的关键词予以视觉上额突出，形成“关键词云层”或“关键词渲染”，从而过滤掉大量的文本信息，使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
复制链接

扫一扫