前言
每次处理综测表时都会很头大,学校发的表里面数据太杂乱,一个一个提会很麻烦,想到可以用python解决这个问题
思路
读取excel数据后用get方法提取出需要的列,存入新的DataFrame中,最后保存即可
所需模块
pandas
安装pandas
pip install pandas
代码
import pandas as pd
def fun(infilepath,outfilepath,list,header):
data = pd.read_excel(infilepath, header=header-1)
new = pd.DataFrame(data.get(list))
new.to_excel(outfilepath ,columns=None, index=False)
if __name__ == '__main__':
infp=r"inputfilepath/filename.xls"
outp = r"outputfilepath/newfilename.xls"
list=[]
fun(infp,outp,list,3)
fun(infp,outp,list,2)
此处的infp是待处理文件路径
outp是保存文件路径
3是从第3行开始读取表(因为有时列名前几行会有那种表的名称,但是并不是我们所想要的)
list列表中装列名即可