Python学习之Excel处理-3-之pandas

最新推荐文章于 2024-04-20 17:27:15 发布

Chaunceyin

最新推荐文章于 2024-04-20 17:27:15 发布

阅读量595

点赞数

分类专栏： Python成长记文章标签： python excel

本文链接：https://blog.csdn.net/qq_39808656/article/details/112909186

版权

Python成长记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文详细介绍了如何使用Python的pandas库读取、操作和保存Excel文件。通过实例展示了如何读取Excel数据，设置或忽略表头，指定行作为索引，以及打印数据的前两行和后两行。此外，还提到了如何去除自动添加的Index并保存到新的Excel文件中。

摘要由CSDN通过智能技术生成

本文记录用pandas对Excel 进行处理，首先我们从最基本的操作开始。Let’s go!

我们先创建一个Excel，名字叫Test.xlsx，用来演示，如下图所示：

让我们用代码对她进行操作吧

import pandas as pd # 引入模块

dataExcel = pd.read_excel("Test.xlsx") # 读取建立好的文件
print(dataExcel.shape)                 # 打印几行几列

打印结果如下：(3, 5)，这里的意思是三行五列，但是我们可以看到，创建的文件是四行五列，这是因为第一行默认为表头。

我们可以把表头打印出来：

print(dataExcel.columns)  # 打印表头

结果：Index(['列1', '列2', '列3', '列4', '列5'], dtype='object')

如果我们的第一行不是表头，则我们可以有以下操作：

dataExcel = pd.read_excel("Test.xlsx", header=None) # 没有表头的情况下，自己加一个需要手动加一个
dataExcel.columns = ("赵", "钱", "尹", "耿", "张",)  # 自己加入的表头
dataExcel.to_excel("copy.xlsx")                     # 保存到另一个文件中

结果如下图所示：

可以看到程序自动加了Index，不过没关系，如果不想要则可以将其去掉。

加入以下代码去掉自动加上的Index，并且指定那一列为Index

dataExcel.set_index("赵", inplace=True) # 将表格中自动生成的Index去掉，并指定那一列为Index

可以看到以下结果：

在读取文件时，我们可以把第一列作为Index

dataExcel = pd.read_excel("Test.xlsx", index_col="列1") # 将第几列作为Index，这里是列1，也可以是其他列

其他小知识点：

print(dataExcel.head(2))  # 打印前两行
print(dataExcel.tail(2))  # 打印后两行

Chaunceyin

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录