在Python中读取Excel文件

在Python中读取Excel文件,最常用的库是openpyxl(针对.xlsx格式)和xlrd(针对.xls格式,但请注意xlrd从版本2.0开始不再支持.xlsx文件)。

推荐使用openpyxlpandas则成为了处理.xlsx文件

1、使用openpyxl读取.xlsx文件

首先,需要安装openpyxl库:

pip install openpyxl

 

然后,可以使用以下代码读取.xlsx文件:

from openpyxl import load_workbook  
  
# 加载工作簿  
wb = load_workbook(filename='example.xlsx')  
  
# 激活工作表  
sheet = wb.active  
  
# 读取A1单元格的值  
value = sheet['A1'].value  
print(value)  
  
# 遍历所有行  
for row in sheet.iter_rows(values_only=True):  
    print(row)

 

2、使用pandas读取Excel文件

pandas是一个强大的数据分析和处理库,它也提供了读取Excel文件的功能。首先,需要安装pandasopenpyxlpandas用于数据处理,openpyxl用于读取.xlsx文件):

pip install pandas openpyxl

 

然后,可以使用以下代码读取Excel文件:

import pandas as pd  
  
# 读取Excel文件  
df = pd.read_excel('example.xlsx', engine='openpyxl')  

# 显示前几行数据  
print(df.head())  
  
# 访问特定列  
print(df['ColumnName'])

注意:

engine='openpyxl'参数指定了用于读取Excel文件的底层库。pandas支持多种Excel文件读取引擎,但openpyxl是专门用于读取.xlsx(即Excel 2007及以上版本的文件)文件的。

如果不指定engine参数,pandas通常会自动选择适当的引擎来读取文件,但这样可能会出现兼容性问题或错误。

 

3、注意

使用pandas读取Excel文件的好处在于,它提供了丰富的数据处理功能,如数据清洗、筛选、分组等。

因此,如果只是需要读取Excel文件并对其进行简单的操作(如获取单元格值),openpyxl可能就足够了。但如果需要进行复杂的数据分析或处理,选pandas更好。

 

  • 8
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值