演示视频
python读取Excel表格数据pandas读取表格read_excel函数使用_哔哩哔哩_bilibili
read_excel函数
-
实现功能
调用python多个Excel表格数据处理引擎,读入后返回pandas.Dataframe对象,是目前数据处理中比较主流的一种方式,需要先安装pandas模块:pip install pandas
-
参数解析
-- 调用读取函数示例
import pandas as pd
path = "./test.xlsx"
data = pd.read_excel(path)
print(data)
-- read_excel()函数默认参数
def read_excel(
io,
sheet_name=0, #表格名或序号
header=0, #指定列名所在行行号,从0开始
names=None, #表路径
index_col=None, #指定行索引
usecols=None, #需要读入的列名或序号([列名1,列名2]),或excel中自带列名ABCD...如(“A,B”)或("A:D")
squeeze=False, #读入数据只一列时转Series对象,默认不转
dtype: DtypeArg | None = None, #指定读取列的数据类型,可接收字典
engine=None, #该参数为指定Excel处理引擎
converters=None, #对某一列使用Lambda函数,进行某种运算
true_values=None, #同false_values一起使用,若在列表中则数据变true
false_values=None, #同true_values一起使用,若在列表中数据变false
skiprows=None, #跳过前几行,可传列表跳过多行(列名行为第0行),也可以传入Lambda函数如读取偶数行:skiprows=lambda x:x%2==0
nrows=None, #读入几行
na_values=None, #将指定的值设置为NaN,可传列表
keep_default_na=True, #是否默认保持空值NaN,默认True
na_filter=True, #是否标记缺失值,默认True
verbose=False, #貌似还未实现
parse_dates=False, #传入需要进行解析日期列,如日期分三列存放可如下进行解析:parse_dates={"list_date": ["年", "月", "日"]}
date_parser=None, #配合parse_dates,对parse_dates参数传入列进行数据转化利用Lambda函数
thousands=None, #传入千位分隔符,只有在Excel中以文本形式存储的列才需要此参数
comment=None, #忽略每一行传入字符串之后的数据
skipfooter=0, #对应skiprows,跳过后向前几行
convert_float=None, #该参数即将移除
mangle_dupe_cols=True, #暂不支持的参数
storage_options: StorageOptions = None, #存储连接选项
)