Pandas xlsx 文件数据操作（持续更新）

Dawn_Exile

已于 2024-04-25 09:27:45 修改

阅读量424

点赞数 3

分类专栏： Python 文章标签： pandas

于 2024-04-16 22:07:23 首次发布

本文链接：https://blog.csdn.net/weixin_43873569/article/details/137553412

版权

2 篇文章 0 订阅

订阅专栏

利用read_excel()读取文件。
sheet_name指定表格，header指定表头所在行号。

file_path = "XXXX.xlsx"
data = pd.read_excel(file_path, sheet_name='Sheet1', header=0)

shape获取行数和列数。

data.shape[0] # 行数
data.shape[1] # 列数

head()：查看前 $n$ 行数据。
tail()：查看后 $n$ 行数据。
默认是 $5$ 行。

print(data.head(3))

iat：查看指定行和列的数据。
iloc：查看多行多列数据。

print(data.iat[2, 0])
print(data.iloc[0:2, 0])

itertuples()返回行迭代器。

for row in data.itertuples():
	print(row)

切片方式
loc、iloc通过下标或索引标签访问数据并修改。

data.loc[i, j] = "XXX" # i：行号 j：列号

PS：直接把data当作二维数据对data[i][j]进行修改后，使用itertuples()遍历data发现数据并未被修改。

insert：插入一列数据
loc指定插入列的索引（从0开始），column指定插入列的列名，value指定插入列的值。

insert_list = [1, 2, 3, 4, 5] # 插入数据的长度=表格的行数（不包含表头），相当于在原表格上增加了一列新属性
data.insert(loc=0, column='XXX', value=insert_list)

关注

专栏目录