最近因为共工作需要,开始接触Python,首先学习的就是Pandas包里面如何读取Excel。分享一下经验,做个笔记。
1、首先需要调用Pandas包,用到语句:
import pandas as pd
2、读取Excel的命令为:pd.read_excel,现在用一个例子做解释:
df=pd.read_excel('C:\Users\zz\Desktop\out_file.xlsx',sheet_name=0)
其中,'C:\Users\zz\Desktop\out_file.xlsx’表示所要读取的名为out_file的Excel文件所在路径。sheet_name=0表示out_file表格中的第一页表格。这里做个详细的说明。
关于表格路径sheet_name=0,表示为第一页表格(Sheet1),sheet_name=1表示为第二页表格(Sheet2),以此类推。如果自己的表格中将Sheet1命名为其他名字 如(cx),则在读取表格的时候,可以用
df=pd.read_excel(‘C:\Users\zz\Desktop\out_file.xlsx’,‘Sheet1’)或者df=pd.read_excel(‘C:\Users\zz\Desktop\out_file.xlsx’,‘cx’)
另外,在读取路径的时候,也可以用这种表达方式:excel_1=‘C:\Users\zhaohr\Desktop\out_file.xlsx’
如下:
excel_1='C:\Users\zhaohr\Desktop\out_file.xlsx'
df=pd.read_excel(excel_1,sheet_name=0)
3、还有一个功能,如果想输出表格的前几行,可以用到print df.head()命令,默认前5行。
例如想输出前4列,用:
print df.head()[0:4]
若想输出指定列的前4行,可用
print df.head()[u'yi'][0:4]
其中’yi’为该列的名称,注意,只能显示前5行。