相信熟悉“词云图”的朋友都知道,“词云图”是用来做词频分析的可视化图形。
在Python中,我们可以用pyecharts做词云图,也可以使用matplotlib来绘制词云图,并且matplotlib绘制出来的词云图更具个性化。
材料:TXT格式的文件、jupyter notebook、PPT、电脑、Python中的jieba分词库、wordclound库、matplotlib库、微信截图或其它工具等。
数据结构:
# 导入相关的库
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 导入文本数据并进行简单的文本处理。注意文本的编码为gbk或utf-8等
text = open(r"C:\Users\QDM\Desktop\SAP出库价\9-07\ciyun.txt",encoding ="gbk").read()
# 去掉换行符和空格
text = text.replace('\n',"").replace("\u3000","")
# 强迫症预览一下加载进来的内容
text