最近太懒了,以后会经常更新博客,记录每天的收获,加油!
1、python读取excel表格
1)导入模块: import xlrd
2)选择excel文件:excel = xlrd.open_workbook('test.xls')
注意:若excel文件与py文件不是同一个路径,则需要在excel名称前添加其绝对路径。
3)选择sheet表:table = excel.sheets()[0]
注意:0代表excel里面的第一个表格,依此类推。
4)读取表中数据:(注意:行数和列数从0算起)
读取数据表行数:nrows = table.nrows
读取数据表列数:ncols = table.ncols
定义存储数据列表:data = []
循环表格行数存储数据:for i in range(0, table.nrows):
data.append(table.row_values(i))
5) 获取第i行数据:
方式1:从存储数据的列表中获取:rowdata_i = data[i]
方式2:从table中直接读取: rowdata_i = table.row_values(i)
方式3:见7)
方式4:见8)
6) 获取第j列数据:
方式1:从table中直接读取: coldata_j = table.col_values(i)
方式2:见7)
方式3:见8)
7)获取第i行第j列数据:(注意:非数值列转化为矩阵时自动忽略)
导入科学计算库: import panda as pd
将数据转成表格型数据结构:data = pd.DataFrame(data)
获取第i行数据: rowdata_i = data.loc[i] (位置索引)
rowdata_i = data.iloc[i] (基于标签的索引)
获取前i行数据:rowdata_1toi = data[: i]
获取第j列数据:coldata_j = data[j]
获取第i行第j列数据:data_ij = data[i][j]
8) 将数据变成数组
导入高性能科学计算和数据分析的基础包:import numpy as np
将数据转成数组格式:data = np.array(data)
获取第i行数据: rowdata_i = data[i]
获取前i行数据: rowdata_1toi = data[: i]
获取第j列数据: coldata_j = data[:,j]
获取第i行第j列数据:data_ij = data[i][j]