#python数据的导入与导出
##excel的导入 ###小数据pandas的导入 ####pandas读取excel单个sheet data=pd.read_excel(r"C:\Users\86130\Desktop\上海统计分析python20191217\data\短期绩效.xlsx", sheet_name=“b2”, header=5, usecols=“f:l”, ) data.head(6).tail(3)
(1)首先文档路径的输入,先复制文档的路径,是单\的,前面要加r,可以去掉一些错误字符。也可以把文档路径单\换成\,不加r。
(2)sheet_name=‘b2’,如果没写,则默认读取excel第一个sheet,如有有则,则读取对应sheet_name对应的数据
(3)header=5,即第6行做变量,header=None,即没有变量,没写默认第一行为变量名
(4)usecols=“f:l”,即取从f至l列;usecols=5,一共5列 (6)skipfooter=8 最后尾部8行不读取
(7)skiprows=22 开始22行不读取 (8)data.head(6) 显示数据前6行 data.tail(3)
显示数据后3行 ####读入多张excel表
with pd.ExcelFile(r"C:\Users\86130\Desktop\上海统计分析python20191217\data\短期绩效.xlsx") as xls: df1=pd.read_excel(xls,“a1”) df2=pd.read_excel(xls,“b2”) df3=pd.read_excel(xls,“c3”) ###单个excel表格式为xlsx,可以读取100+万行 import openpyxl filename=r"C:\Users\86130\Desktop\上海统计分析python20191217\data\短期绩效.xlsx" inwb=openpyxl.load_workbook(filename)
gsheet=inwb.get_sheet_names()
sname=inwb.get_sheet_by_name(gsheet[0])
dataset=[]
for r in range(1,sname.max_row+1):#range(1,102)
col=[]
for c in range(1,sname.max_column+1):#识别最大列,但好像有bage,因此+1
col.append(sname.cell(r,c).value)
dataset.append(col)
dataset[0:5]
python数据导入方法
最新推荐文章于 2024-05-02 15:35:53 发布