参考链接:https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html#excel-files
https://www.jianshu.com/p/d1eed925509b
读取excel文件
在这里需要注意!!!使用pandas每次打开文件的时候行索引都会变为0,1,2,3,4……,所以写excel的时候需要去除索引
pd.read_excel(
'path_to_file.xls', # xlsx文件的路径
sheet_name='Sheet1', # 'Sheet1'读取'Sheet1' , 也可以是一个列表[0,1]:读取前两个sheet
header=3, # 从第3行开始读,且第2行为列索引
index_col=[3], # 第三列为行索引
names=list('abcd') # 修改列标签为 'a','b','c','d'
usecols='a' # 'a': 只读第’a'列 ['a','c']:读取'a','c'列;[0,1,2]或[0]:只读第0,1,2列或者只读第[0]列;3:只读前三列
skiprows=2 # 自上而下省略两行
skip_footer=2 # 自下而上省略两行
)
usecols也可以是一个函数:
pd.read_excel(‘path_to_file.xls’, ‘Sheet1’, usecols=lambda x: x.isalpha())
写入excel文件
data.to_excel(‘file.xlsx’,index=None) # 不写入index