本次推送给大家详细介绍pandas.read_excel的一些常用功能,使我们更方便地运用Python对Excel文件进行数据处理。我们用一个例子来介绍pandas.read.excel的用法,数据用到是Excel下两个Sheet,Sheet1是math grade,Sheet2是 English grade。
// sheet_name用法
如果想要导入EXCEL里特定的Sheet,则可以用sheet_name=[‘’],不输入则默认导入第一个sheet ,若想导入两个及以上sheet则可以用逗号隔开。如下两幅图,没用使用sheet_name默认导入的是sheet1:mathgrade,使用sheet_name则可以指定导入想要的sheet。 ●●//header/names用法
names是用来给导入的EXCEL列命名或重命名,若是数据本身没有表头,需要命名,则要header=None连用。如下图我们可以看到,第一张对表列名进行了重命名,第二张加入header=None原本的列名被视为数据,names则是给数据新加上列名。 ●●// comment用法
在EXCEL中,我们时常会给数据进行备注,导入数据时,我们可能并不愿意让它出现,此时可以用到comment,如下图,Tylor没有来考试,我们'#'对正文和备注进行了分隔备注了absent,当我们用comment=‘#’(‘ ’内即用来分隔注释和正文的符号)时,导入数据不再显示注释内容 ●●// usecols/skiprows/nrows/index_col用法
有时候我们并不需导入全部的数据,只想导入特定的行列。 Usecols:确定导入的列,如下即是导入a到c列; skiprows:从文件开头起要跳过的行; nrows:从文件开头起导入的行数; index_col:用于确定作为索引的列,如:index_col=’name’用名字索引,index_col=’id’用学号索引。 ●●// converters/dtype用法
有的时候我们要对数据固定类型。 converters:在某些列中转换值的函数的命令。键可以是整数或列标签,值是接受一个输入参数的函数,Excel单元格内容,并返回转换后的内容; dtype:确定数据或列的数据类型。(converters和dytpe不要同时使用哦)如下图,用converters将分数固定成了整型 ●●// 其他一些参数简介
verbose:打印各种解析器输出的信息,比如非数值列中缺失值数量。
squeeze:如果解析数据只包含一列,返回一个series。
thousands:将字符串列解析为数字的数千个分隔符。
na_values:需要用NA替换的值序列。
skip_footer:忽略文件尾部行数。
parse_dates:尝试将数据解析为datetime,默认是False。如果为True,将尝试所有的列,也可以指定列名解析。●●
参考文献 ●●
// 1
|https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html?highlight=read_excel#pandas.read_excel
// 2
|《利用python进行数据分析》.Wes Mckinney