大数据可视化技术与应用的作业一总结
可视化课的第一次作业,老师让我们参照课本做出个性化的词云图,以下是此次做作业过程中关于背景色,成品效果不好等等问题的总结。
最终做出的词云图:
这是我参考书本上的例子经修改过后运行的代码:
from PIL import Image#导入PIL库,应用Image进行图片归档
import matplotlib.pyplot as plt#导入matplotlib库,用于显示图形
from wordcloud import WordCloud#导入Wordcloud库制作词云图
import numpy as np
import jieba#分词
plt. figure(figsize=(10,10))#图片大小
with open('C:/Users/lenovo/Desktop/123.txt','r',encoding = 'utf-8')as f:#以只读的方式打开文档
text = f.read()
cut_text = open('C:/Users/lenovo/Desktop/123.txt', 'r', encoding='utf-8').read()
cloud = WordCloud(
font_path="C:/Windows/Fonts/simkai.ttf",#指定字体
mask = np.array(Image.open('C:/WPy64-3760/Notebooks/jieba/star.jpg')),#
background_color = 'mistyrose',#图片背景颜色
max_words = 500,
max_font_size = 100#规定字体的大小
).generate(cut_text)
plt.imshow(cloud,interpolation = 'bilinear')
plt.axis('off')
plt.show()#展示图片
总结:
-
第六句:plt. figure(figsize=(10,10))#图片大小
这句直接的影响到了最终出来的词云图成品的清晰度,最初我没有应用这句话,导致出来的图片包括汉字都十分的模糊; -
报错:SyntaxError: invalid syntax
在学python语言基础时,我们便知道了python对缩进、英文符号等格式的要求是非常的仔细的,这句报错意味着存在着格式问题,比如漏了字符,或者用成了中文字符等等; -
第十三句:background_color = ‘mistyrose’,
这句规定了图片的背景颜色,除了white白色以外,我还尝试了blue,red等我们所熟悉英文的颜色词汇,但是这样的颜色往往饱和度太高,会有点喧宾夺主,词语就失了色彩,所以我查询了python能应用的颜色,下图这些我想对于我们来说,应该已经够用了。我最后选择了mistyrose这个淡淡的粉色作为背景色,我们熟悉的pink与它相比,过于鲜艳了。
-
第十五句:max_font_size = 100
这句是用来规定词云图上的字体的最大限度。参照课本上的举例,跟着这一句的还有一句:min_font_size = 用来规定字体的最小限度,但是在文本数据不够大的情况,如果将范围定制的太小(即最大最小值之差太小)时,很容易出现词云图上只有几个词语孤零零的飘在上面,出来的图片效果是不太好的。鉴于做作业时的文本数据有点小,我就直接将字体最小的限度这一句给删除了,这样出来的图片效果较好。 -
在导入文档、图片等等时,将路径标出来时,应该注意用“/”,而不是“\”’.
-
想做出其他形状的词云图,选择的图片一定要色块分明,形状轮廓清晰。
最后:
其实这只是很小的一次动手作业,但出现的一些问题我觉得还是值得记录下来的,希望自己能养成总结作业的习惯。
若有错误,敬请各位指正。