词云图能够帮助我们直观又清晰地进行数据可视化。课上以十四五规划内容为例,练习数据可视化相关代码,在此记录一些对于输入代码之时遇到的不懂之处以及我自己的理解。
import os
from wordcloud import WordCloud
import matplotlib.pyplot as plt
print(os.getcwd())#打印路径
text=open("C145.txt",'r',encoding='utf-8').read()
wc=WordCloud(font_path="C:\Windows\Fonts\Micrsoft YaHei UI\msyh.ttc").generate(text)
plt.imshow(wc)
plt.axis('off')#关闭坐标轴
plt.show()
wc.to_file('C145-1.jpg')
- 生成词云图的时候,如果文件里是中文,那么需要设置一个中文字体,否则生成的图片每个字可能是方块;
- 没有plt.imshow(),输出时无法显示图片;
- plt默认RGB通道;
import os
import jieba
from wordcloud import WordCloud,ImageColorGenerator#从图中提取颜色的面孔
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
mask=np.array(Image.open('star.jpg'))
with open("C145.txt",'r',encoding=