1.基本读取
import pandas as pd
people=pd.read_excel('文件路径')
#获取excel表有多少行与列
print('people.shape')
#读取excel表的列名
print(people.columns)
#打印excel表前几行(默认5行)
print(people.head())
#打印excel后几行
print(people.tail())
2.常见情况
#第一行header有脏数据,不是正确的header,header默认是0,此时应该将header设为1
people=pd.read_excel('文件路径',header=1)
print(people.columns)
#当第一行全部是空行的时候,此时是不用写header=1,会默认将空行跳过去的
#如果第一行有部分列是空行的时候,采用的办法仍然是将header=1,解决脏数据造成的header错误。
#当没有header,需要人为的添加header的时候
people=pd.read_excel('文件路径',header=None)
people.columns=['列名1','列名2','列名3']
#此时添加生成的excel文件会多一列 自动生成的index 列
#处理办法
people.set_index('列名1',inplace=True)
print(people.columns)
people.to_excel('文件存放路径') #将文件存储
print('Done')
3.读取文件时指明文件中的index列
import pandas as pd
df=pd.read_excel('文件路径',index_col='列名1')
df.to_excel('保存文件路径')
print('Done')