一、Excel文件的读取与写入
1、读取操作步骤:
导入模块xlrd
打开工作薄Book
指定工作薄中的表单Sheet
根据行列序号读取内容
#导入模块xlrd import xlrd #打开工作薄Book wb = xlrd.open_workbook('../Stu_pack/school.xls') #指定工作薄中的工作表Sheet sheet = wb.sheet_by_index(0)
#根据行列序号读取内容 schools = [] #定义一个二维列表schools for row in range(sheet.nrows): school = [] #定义一个一维列表school for col in range(sheet.ncols): content = sheet.cell_value(row,col) #读取单元格内容保存在变量content中 school.append(content) schools.append(school)
i = 1 for school in schools: if i<12: print(school) i+=1
['招生单位代码', '招生单位名称', '所在省份', '是否985', '是否211', '是否自主划线', '学校类型'] ['10001', '北京大学', '北京市', '是', '是', '是', '综合类'] ['10002', '中国人民大学', '北京市', '是', '是', '是', '综合类'] ['10003', '清华大学', '北京市', '是', '是', '是', '理工类'] ['10004', '北京交通大学', '北京市', '否', '是', '否', '理工类'] ['10005', '北京工业大学', '北京市', '否', '是', '否', '理工类'] ['10006', '北京航空航天大学', '北京市', '是', '是', '是', '理工类'] ['10007', '北京理工大学', '北京市', '是', '是', '是', '理工类'] ['10008', '北京科技大学', '北京市', '否', '是', '否', '理工类'] ['10009', '北方工业大学', '北京市', '否', '否', '否', '理工类'] ['10010', '北京化工大学', '北京市', '否', '是', '否', '理工类']
2、Excel文件的写入操作步骤:
导入模块:xlwt
构造工作薄:Workbook
为工作薄添加表单:Worksheet
根据行列序号写入内容
保存文件
#将上面的Excel文件内容,写入另一个Excel中并保存到R&Q_pic文件夹里面,对学校所在省份进行简单判断,第一行合并单元格显示标题。 import xlrd import xlwt #定义读取school.xls文件函数 def read_excel(file_name): wb = xlrd.open_workbook('../Stu_pack/school.xls') sheet = wb.sheet_by_index(0) schools = [] #定义一个二维列表schools for row in range(sheet.nrows): school = [] #定义一个一维列表school for col in range(sheet.ncols): content = sheet.cell_value(row,col) #读取单元格内容保存在变量content中 school.append(content) schools.append(school) return schools #定义写入Excel文件函数 def write_excel(schools): #构造工作薄:Workbook wb = xlwt.Workbook(encoding = 'utf-8') #为工作薄添加工作表Worksheet sheet = wb.add_sheet('上海市高校信息表') #根据行列序号写入内容 sheet.write_merge(0,0,0,6,'上海高校信息表') #合并第一行第一列和第一行第7列单元格,前面两个0代表行,后面的0和6代表列,从0开始表示第一行第1列 for col in range(7): #写列表名称 sheet.write(1,col,schools[0][col]) #第2行第1列开始写school[0][col] row_num = 2 #从第3行开始写入数据内容 for school in schools: if school[2] == '上海市': for col in range(7): sheet.write(row_num,col,school[col]) row_num = row_num + 1 #保存文件 wb.save('../R&Q_pic/上海市高校信息表.xls')
In [55]:
#函数的调用 school_list = read_excel('../Stu_pic/school.xls') #调用读取文件函数并创建列表对象school_list write_excel(school_list) #调用写入文件函数并保存到指定文件夹
In [63]:
#在当前窗口读取“上海市高校信息表.xls”文件内容 i=1 school_list = read_excel('../R&Q_pic/上海市高校信息表.xls') for school in school_list: if i<13: print(school) i+=1
['招生单位代码', '招生单位名称', '所在省份', '是否985', '是否211', '是否自主划线', '学校类型'] ['10001', '北京大学', '北京市', '是', '是', '是', '综合类'] ['10002', '中国人民大学', '北京市', '是', '是', '是', '综合类'] ['10003', '清华大学', '北京市', '是', '是', '是', '理工类'] ['10004', '北京交通大学', '北京市', '否', '是', '否', '理工类'] ['10005', '北京工业大学', '北京市', '否', '是', '否', '理工类'] ['10006', '北京航空航天大学', '北京市', '是', '是', '是', '理工类'] ['10007', '北京理工大学', '北京市', '是', '是', '是', '理工类'] ['10008', '北京科技大学', '北京市', '否', '是', '否', '理工类'] ['10009', '北方工业大学', '北京市', '否', '否', '否', '理工类'] ['10010', '北京化工大学', '北京市', '否', '是', '否', '理工类'] ['10011', '北京工商大学', '北京市', '否', '否', '否', '']
二、词云库wordcloud(第三方库)的安装与运用
1、安装
pip install wordcloud
python -m pip install
pip install wordcloud
The following command must be run outside of the IPython shell: $ pip install wordcloud The Python package manager (pip) can only be used from outside of IPython. Please reissue the `pip` command in a separate terminal or command prompt. See the Python documentation for more information on how to install packages: https://docs.python.org/3/installing/
import wordcloud
2、应用
生成步骤:创建词云对象——》加载词云文本——》输出词云图片(文件)
默认的矩形词云库图片
提供的图形词云库图片
#示例1:生成默认的矩形词云库图(原文件为英文) import wordcloud wc = wordcloud.WordCloud() wc.generate('上海电子信息职业技术学院通信与信息工程学院孙佳佳') #3\加载词云文本 wc.to_file('../R&Q_pic/test.png')
import wordcloud with open('../Stu_pic/See You Aganin.txt')as file: fr = file.read() wc = wordcloud.WordCloud() wc.to_file('../R&Qpic/SYA.png')