目录
简介:
词云(Word Cloud)是一种数据可视化技术,主要用于文本数据的展示。它通过大小、颜色、字体等视觉元素来展示文本数据中的词汇频率,帮助用户快速识别文本中的关键信息或主题。主要特点有:直观性:词云以图形化的方式呈现文本数据,使得用户能够直观地看到哪些词汇在文本中出现得更为频繁。灵活性:词云可以根据用户的需求进行定制,例如通过改变词汇的大小、颜色、字体等属性来强调特定的信息。易读性:在词云中,高频词汇通常会被放大并置于更显眼的位置,这使得用户能够更快地捕捉到文本中的关键信息。
照葫芦画瓢操作展示:
将自己的txt文本地质替代下面第一个” ”内容。(txt文件内容如上简介类似复制到txt保存也可)
选择自己想要展示的图片形状,复制图片保存的地址代替下面“ ”内容
图片要是黑白的不然无法模拟该图片形状!!!!!!!!!!!
结果展示:
代码展示(Python)
from wordcloud import WordCloud
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba
# 打开文本新闻复制的文字也行
with open("C://Users//86182//Desktop//ciyun.txt",encoding="utf-8") as f:
s = f.read()
# 中文分词
text = ' '.join(jieba.cut(s))
imge = Image.open("C://Users//86182//Desktop//R-C.jpg")#黑白底的要
mask = np.array(imge) #将图片转换为数组
#一些语气词、介词等步不想展示的词可以去掉并借此划分词语
stopwords = ["我","你","她","的","是","了","在","也","和","就","都","这"]
WC = WordCloud(font_path="msyh.ttc",
mask=mask,
width = 1000,
height =700,
background_color='white',
max_words=400,
stopwords=stopwords).generate(text)
plt.imshow(WC, interpolation='bilinear')# 用plt显示图片
plt.axis("off") # 不显示坐标轴
plt.show() # 显示图片