详解pandas的read_excel函数

一、官网参数

        pandas官网参数网址:pandas.read_excel — pandas 1.5.2 documentation

如下所示:

 二、常用参数详解

1、io

        一般指读取文件的路径。【必须指定】

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx")

print(df)

 2、sheet_name

        因为一个excel文件有多个sheet,所以可以通过此参数,指定读取哪个sheet。【默认读取第一个sheet】

 读取sheet1:

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet1')

print(df)

 

  读取sheet2:

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet2')

print(df)

3、header(表头)

 表头即列名,默认第0行数据为表头。【从0开始计数】,以下为excel示意表头。

同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

4、names(列名)

 用于原始数据无表头,又想设置列名的情况。如下数据,直接读取,默认0、1、2为列名:

 同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

5、dtype(数据类型)

  指定字段数据类型。例如:

  同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

6、engine(引擎)

        指定解析数据时使用的引擎。支持的引擎包括:“xlrd”, “openpyxl”, “odf”, “pyxlsb”。各个引擎的区别在于:

  • xlrd支持旧式的Excel文件,如xls文件。pandas1.2.0发生变化,xlrd引擎现在只支持解析xls文件。
  • openpyxl支持较新的Excel文件格式。
  • odf支持OpenDocument文件格式如odf,ods,odt。
  • pyxlsb支持二进制Excel文件。

此参数默认为None,pandas会自动判断数据格式进行引擎的使用。

(1)如果数据格式为  xls  文件格式,可选引擎  xlrd、openpyxl;

(2)如果数据格式为  xlsx  文件格式,可选引擎  openpyxl;

【如果碰到特别老的xls文件,当openpyxl不可用时,需要选择xlrd引擎】

其他引擎同理,多数情况用不上。

7、skiprows(跳过指定行)

        对于前N行数据不想要读进内存,可以指定此参数跳过。

 同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

以上就是最常用的pandas读取数据文件参数信息。

公众号内有更多干货分享哦~~

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,关于 Pandasread_excel() 和 to_excel() 函数的各参数详解,我来给你解释一下。 首先,read_excel() 函数用于读取 Excel 文件中的数据,并且可以将其转换成 Pandas 中的 DataFrame 对象。它的基本语法如下: ```python pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, **kwds) ``` 其中,一些常用的参数如下: - io:要读取的 Excel 文件名或 URL; - sheet_name:要读取的工作表名称或索引,可以是字符串、整数或列表,默认值为 0,即第一个工作表; - header:指定作为列名的行号,默认为 0,即第一行; - names:指定列名,如果 header=None,则必须指定; - index_col:指定作为行名的列号或列名,可以是整数、字符串或 None,默认为 None; - usecols:要读取哪些列,可以是列名或列号,也可以是列表; - dtype:指定每一列的数据类型; - na_values:将指定值识别为 NaN; - skiprows:要跳过的行数; - nrows:要读取的行数; - parse_dates:尝试将指定列解析为日期; - converters:将指定列转换为特定的类型。 而 to_excel() 函数则用于将 DataFrame 对象写入到 Excel 文件中。它的基本语法如下: ```python DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None) ``` 其中,一些常用的参数如下: - excel_writer:要写入的 Excel 文件名或 ExcelWriter 对象; - sheet_name:要写入的工作表名称; - na_rep:将 NaN 值替换为指定的字符串; - float_format:浮点数的格式; - columns:要写入的列,可以是列名或列号,也可以是列表; - header:是否写入列名,默认为 True; - index:是否写入行名,默认为 True; - index_label:行名的名称; - startrow:从哪一行开始写入,默认为 0; - startcol:从哪一列开始写入,默认为 0; - merge_cells:是否合并单元格; - encoding:指定编码方式。 以上是 read_excel() 和 to_excel() 函数的各参数详解,希望能对你有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值