作者 | 黄伟呢 来源 | 数据分析与统计学之美 我觉得很有必要讲述这个文章,进行数据处理的第一步就是Python数据读取。但是你可能没想到,在进行数据读取的同时,我们其实可以配合相关参数做很多事儿,这对于后续的数据处理都是极其有帮助。 read_excel()函数和read_csv()函数,在参数上面有很多相同点,因此我就以read_excel()函数为例,进行详细的说明。
1)sheet_name参数
含义:选择要读取的sheet表;
sheet_name=0表示默认读取第一个sheet表,等同于sheet_name=“sheet名称”;
sheet_name=[“sheet名”,0]会返回一个字典,然后可以利用键获取每一个sheet表中的数据;
sheet_name=None也会返回一个字典,但是会返回全部的sheet表;
① sheet_name=0和sheet_name="Sheet1"
# 下面这两个读取方式等同。#df2 = pd.read_excel("readexcel.xlsx",sheet_name=0)
df2 = pd.read_excel("readexcel.xlsx",sheet_name="Sheet1")
df2
结果如下:
② sheet_name=[“sheet名”,0]
df2 = pd.read_excel("readexcel.xlsx",sheet_name=[0,1])
df2
结果如下:
接着,我们可以使用键值对的方式,获取每个sheet表中的数据。
注:关于sheet_name=None效果同上,只不过会返回所有的sheet表中的数据。
2)header参数
- 含义:指定某一行作为表头;
- header=None专门针对没有表头的表,这也是默认值;
- header=1指定第一行作为表头&#x