Python学习之Excel处理-3-之pandas

本文详细介绍了如何使用Python的pandas库读取、操作和保存Excel文件。通过实例展示了如何读取Excel数据,设置或忽略表头,指定行作为索引,以及打印数据的前两行和后两行。此外,还提到了如何去除自动添加的Index并保存到新的Excel文件中。
摘要由CSDN通过智能技术生成

本文记录用pandas对Excel 进行处理,首先我们从最基本的操作开始。Let’s go!

  • 我们先创建一个Excel,名字叫Test.xlsx,用来演示,如下图所示

  • 让我们用代码对她进行操作吧
import pandas as pd # 引入模块

dataExcel = pd.read_excel("Test.xlsx") # 读取建立好的文件
print(dataExcel.shape)                 # 打印几行几列

打印结果如下:(3, 5),这里的意思是三行五列,但是我们可以看到,创建的文件是四行五列,这是因为第一行默认为表头。

  • 我们可以把表头打印出来:
print(dataExcel.columns)  # 打印表头

结果:Index(['列1', '列2', '列3', '列4', '列5'], dtype='object')

  • 如果我们的第一行不是表头,则我们可以有以下操作:
dataExcel = pd.read_excel("Test.xlsx", header=None) # 没有表头的情况下,自己加一个需要手动加一个
dataExcel.columns = ("赵", "钱", "尹", "耿", "张",)  # 自己加入的表头
dataExcel.to_excel("copy.xlsx")                     # 保存到另一个文件中

结果如下图所示:

可以看到程序自动加了Index,不过没关系,如果不想要则可以将其去掉。

加入以下代码去掉自动加上的Index,并且指定那一列为Index

dataExcel.set_index("赵", inplace=True) # 将表格中自动生成的Index去掉,并指定那一列为Index

可以看到以下结果:

  • 在读取文件时,我们可以把第一列作为Index
dataExcel = pd.read_excel("Test.xlsx", index_col="列1") # 将第几列作为Index,这里是列1,也可以是其他列
  • 其他小知识点:
print(dataExcel.head(2))  # 打印前两行
print(dataExcel.tail(2))  # 打印后两行

 

 

 

 

 

 

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值