pandas读取Excel文档数据

喜马高

已于 2022-10-04 22:08:00 修改

阅读量1.8k

点赞数

分类专栏： python 文章标签： pandas python 数据分析

于 2022-10-04 20:44:52 首次发布

本文链接：https://blog.csdn.net/archiecsdn/article/details/127158570

版权

python 专栏收录该内容

11 篇文章 2 订阅

订阅专栏

演示视频

python读取Excel表格数据pandas读取表格read_excel函数使用_哔哩哔哩_bilibili

read_excel函数

实现功能

调用python多个Excel表格数据处理引擎，读入后返回pandas.Dataframe对象，是目前数据处理中比较主流的一种方式，需要先安装pandas模块：pip install pandas

参数解析

-- 调用读取函数示例

import pandas as pd
path = "./test.xlsx"
data = pd.read_excel(path)
print(data)

-- read_excel()函数默认参数

def read_excel(
    io,
    sheet_name=0,    #表格名或序号
    header=0,    #指定列名所在行行号，从0开始
    names=None,    #表路径
    index_col=None,    #指定行索引
    usecols=None,    #需要读入的列名或序号([列名1,列名2]),或excel中自带列名ABCD...如（“A,B”）或("A:D")
    squeeze=False,    #读入数据只一列时转Series对象，默认不转
    dtype: DtypeArg | None = None,    #指定读取列的数据类型,可接收字典
    engine=None,    #该参数为指定Excel处理引擎
    converters=None,    #对某一列使用Lambda函数，进行某种运算
    true_values=None,    #同false_values一起使用，若在列表中则数据变true
    false_values=None,    #同true_values一起使用，若在列表中数据变false    
    skiprows=None,    #跳过前几行，可传列表跳过多行(列名行为第0行),也可以传入Lambda函数如读取偶数行：skiprows=lambda x:x%2==0
    nrows=None,    #读入几行
    na_values=None,    #将指定的值设置为NaN，可传列表
    keep_default_na=True,    #是否默认保持空值NaN，默认True
    na_filter=True,    #是否标记缺失值，默认True
    verbose=False,    #貌似还未实现
    parse_dates=False,    #传入需要进行解析日期列，如日期分三列存放可如下进行解析：parse_dates={"list_date": ["年", "月", "日"]}
    date_parser=None,    #配合parse_dates，对parse_dates参数传入列进行数据转化利用Lambda函数
    thousands=None,    #传入千位分隔符，只有在Excel中以文本形式存储的列才需要此参数
    comment=None,    #忽略每一行传入字符串之后的数据
    skipfooter=0,    #对应skiprows，跳过后向前几行
    convert_float=None,    #该参数即将移除
    mangle_dupe_cols=True,    #暂不支持的参数
    storage_options: StorageOptions = None,    #存储连接选项
)