目录
一、词云的定义
词云(Word Cloud)是一种数据可视化技术,它将文本数据中的词汇以视觉化的方式呈现。在词云中,词汇以字体大小、颜色、布局等方式来代表其在文本数据中的重要性或频率。通常,字体越大的词汇在文本中出现的次数越多,从而被视为更重要的词汇。
二、代码需要
1. 库:
from wordcloud import WordCloud import jieba #汉字分词 import matplotlib.pyplot as plt#显示作用
2. .txt文本
你好 恋爱至上主义区域 车如云and泰明河 CP永远存在 都要幸福 冰激凌 巧克力味 前辈 学长 如云 新鞋子 车如云快跑
三、 Python代码
from wordcloud import WordCloud
import jieba #汉字分词
import matplotlib.pyplot as plt#显示作用
'''
方块背景图的词云
'''
# 读取文本文件内容
with open('01-词云.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba进行分词
seg_list = jieba.cut(text, cut_all=False)
seg_str = " ".join(seg_list)
# 设置词云的一些属性
wc = WordCloud(font_path='simli.ttf', # 指定字体路径,需要确保你的环境中有这个字体文件
background_color="white", # 设置背景颜色
max_words=200, # 设置最大显示的词云数
width=1000, # 设置图片的宽度
height=860, # 设置图片的高度
margin=2 # 设置词语间距
).generate(seg_str)
# 使用matplotlib展示词云图
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.show()
# 保存词云图为图片文件
wc.to_file('00-词云.png') # 将词云保存为 00-词云.png 图片文件