1、调用读取函数,将素材里的文件school.xls作为实参传递给形参 school_list = read_excel('../Stu_pack/wordcloud/school.xls') 文件保存是以自己的电脑为主从一个文件到里面的一个文件的地址,每个代码之间要以/分隔开 调用写入函数,将读取的数据作为实参传递给形参写入到文件"上海市高校信息表.xls"里保存 write_excel(school_list) schools_list = read_excel('../R&Q_pic/上海市高校信息表.xls') 此文件保存通过write_excel来写入信息表再通过read_excel来读取文件信息表里的内容 2、由于信息表内文件信息过多,所以可以引进pandas库来帮我们筛选出我们需要的数据 (1)首先我们需要导入pandas库 import pandas as pd tips:如果没有pandas库,需要先下载pandas库,电脑WIN+R,输入cmd,输入pip install pandas即 可以安装!或者输入以下代码 pip install pandas (2) 创建文件对象data data = pd.read_excel('../Stu_pack/wordcloud/school.xls'index_col=0) (3)读取此文件的前十项 data.head(10) tips:10可以改成任何数字,如果写入n,那么默认值为5
(4)获取上海市的表格信息,以及查看是否为985
data = data[data['所在省份']=='上海市']
data = data[data['是否985']=='是']
tips:data[]括号里的条件可以选择需要更改,==后的‘’里面的对象也可以自助修改
3、词云库的安装与应用(生成默认的矩形词云图)
(1) 首先先导入词云库
import wordcloud
tips:如果没有词云库,那么需要先下载词云库pip install wordcloud
(2)导入读取词云文本文件,导入jieba
from PIL import Image
import jieba
(3)读取指定的词云文本文件
with open('../Stu_pack/wordcloud/Dream It Possible.txt',encoding = 'utf-8')as file: fr = file.read()
(4)读取指定文件,将词云文本分割词语并用空格分割开来
fr = jieba.lcut(fr)
(5)用空格连接分割的词语成一个字符串
fr = ' '.join(fr)
(6)创建词云对象
wc = wordcloud.WordCloud(font_path = 'C:\Windows\Fonts\LCALLIG')
(7)加载词云文本
wc.generate(fr)
(8)输出词云文本
wc.to_file('../R&Q_pic/test.jpg')
(9)打开读取指定文件
Image.open('../R&Q_pic/test.jpg')
4、生成默认的矩形词云图片
(1)步骤如上述的题目所述,需要加入的是要导入读取遮罩图片库以及导入数据可视化库的模块基础绘图库 from imageio import imread import matplotlib.pyplot as plt
(2)用plt画图绘制词云图库并显示出来
plt.imshow(wc)
plt.savefig('../R&Q_pic/test2.png')
(3)只显示图片
plt.show()