Pandas xlsx 文件数据操作(持续更新)
读取文件
利用read_excel()
读取文件。
sheet_name
指定表格,header
指定表头所在行号。
file_path = "XXXX.xlsx"
data = pd.read_excel(file_path, sheet_name='Sheet1', header=0)
获取行数和列数
shape
获取行数和列数。
data.shape[0] # 行数
data.shape[1] # 列数
观察数据
head()
:查看前
n
n
n 行数据。
tail()
:查看后
n
n
n 行数据。
默认是
5
5
5 行。
print(data.head(3))
读数据
iat
:查看指定行和列的数据。
iloc
:查看多行多列数据。
print(data.iat[2, 0])
print(data.iloc[0:2, 0])
按行遍历
itertuples()
返回行迭代器。
for row in data.itertuples():
print(row)
修改数据
切片方式
loc
、iloc
通过下标或索引标签访问数据并修改。
data.loc[i, j] = "XXX" # i:行号 j:列号
PS:直接把data
当作二维数据对data[i][j]
进行修改后,使用itertuples()
遍历data
发现数据并未被修改。
插入数据
insert
:插入一列数据
loc
指定插入列的索引(从0
开始),column
指定插入列的列名,value
指定插入列的值。
insert_list = [1, 2, 3, 4, 5] # 插入数据的长度=表格的行数(不包含表头),相当于在原表格上增加了一列新属性
data.insert(loc=0, column='XXX', value=insert_list)