使用pandas读取excel

本文介绍了如何使用Python的pandas库读取Excel文件,详细解析了pd.read_excel()的常用参数,如io、sheet_name、header、names、index_col、usecols、squeeze、converters、skiprows、nrows和skipfooter,帮助提升数据处理效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文为作者原创,未经允许不得擅自转载。

Excel是微软的经典之作,在日常工作中的数据整理、分析和可视化方面,有其独到的优势,尤其在你熟练应用了函数和数据透视等高级功能之后,Excel可以大幅度提高你的工作效率。但如果数据量超大,Excel的劣势也就随之而来,甚至因为内存溢出无法打开文件,后续的分析更是难上加难。那么,有什么更好的解决办法吗?工欲善其事,必先利其器,在这里我们介绍使用Python的pandas数据分析包来解决此问题。

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, 
              usecols=None, squeeze=False,dtype=None, engine=None, 
              converters=None, true_values=None, false_values=None, 
              skiprows=None, nrows=None, na_values=None, parse_dates=False, 
              date_parser=None, thousands=None, comment=None, skipfooter=0, 
              convert_float=True, **kwds)

pandas读取Excel后返回DataFrame,接下来我们就pd.read_excel()的常用参数进行详细解析。


目录

1、io,Excel的存储路径

2、sheet_name,要读取的工作表名称

3、header, 用哪一行作列名

4、names, 自定义最终的列名

5、index_col, 用作索引的列

6、usecols,需要读取哪些列

7、squeeze,当数据仅包含一列

8、converters ,强制规定列数据类型

9、skiprows,跳过特定行

10、nrows ,需要读取的行数

11、skipfooter , 跳过末尾n行


【文中使用英超、西甲的排名积分榜及射手榜作为原始数据~~~】


1、io,Excel的存储路径

  •  建议使用英文路径以及英文命名方式。
import pandas as pd
io = r'C:\Users\Administrator\Desktop\data.xlsx'

2、sheet_name,要读取的工作表名称

  • 可以是整型数字、列表名或SheetN,也可以是上述三种组成的列表
  • 整型数字:目标sheet所在的位置,以0为起始,比如sheet_name = 1代表第2个工作表。

data = pd.read_excel(io, sheet_name = 1)
data.head()

  • 列表名:目标sheet的名称,中英文皆可。
data = pd.read_excel(io, sheet_name = '英超射手榜')
data.head()

  • SheetN:代表第N个sheet,S要大写,注意与整型数字的区别。
data = pd.read_excel(io, sheet_name = 'Sheet5')
data.head()

  • 组合列表: sheet_nam
评论 35
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值