#下面这些变量需要您根据自己的具体情况选择
biaotou=['学号','学生姓名','第一志愿','第二志愿','第三志愿','第四志愿','第五志愿','联系电话','性别','备注']
#在哪里搜索多个表格
#C:\\Users\\lihwa11\\Desktop\\Python\\filename
filelocation="C:\\Users\\lihwa11\\Desktop\\Python\\filename\\"
#当前文件夹下搜索的文件名后缀
fileform="xls"
#将合并后的表格存放到的位置
filedestination="C:\\Users\\lihwa11\\Desktop\\Python\\filename\\"
#合并后的表格命名为file
file="carson"
#首先查找默认文件夹下有多少文档需要整合
import glob
from numpy import *
filearray=[]
for filename in glob.glob(filelocation+"*."+fileform):
filearray.append(filename)
#以上是从pythonscripts文件夹下读取所有excel表格,并将所有的名字存储到列表filearray
print("在默认文件夹下有%d个文档哦"%len(filearray))
ge=len(filearray)
matrix = [None]*ge
#实现读写数据
#下面是将所有文件读数据到三维列表cell[][][]中(不包含表头)
import xlrd
for i in range(ge):
fname=filearray[i]
bk=xlrd.open_workbook(fname)
try:
sh=bk.sheet_by_name("Sheet1")
except:
print ("在文件%s中没有找到sheet1,读取文件数据失败,要不你换换表格的名字?" %fname)
nrows=sh.nrows
matrix[i] = [0]*(nrows-1)
ncols=sh.ncols
for m in range(nrows-1):
matrix[i][m] = ["0"]*ncols
for j in range(1,nrows):
for k in range(0,ncols):
matrix[i][j-1][k]=sh.cell(j,k).value
#下面是写数据到新的表格test.xls中哦
import xlwt
filename=xlwt.Workbook()
sheet=filename.add_sheet("hel")
#下面是把表头写上
for i in range(0,len(biaotou)):
sheet.write(0,i,biaotou[i])
#求和前面的文件一共写了多少行
zh=1
for i in range(ge):
for j in range(len(matrix[i])):
for k in range(len(matrix[i][j])):
sheet.write(zh,k,matrix[i][j][k])
zh=zh+1
print("我已经将%d个文件合并成1个文件,并命名为%s.xls.快打开看看正确不?"%(ge,file))
filename.save(filedestination+file+".xls")
奇了怪了,这里出现了一个问题,就是文件后缀名为xlsx则会出现失败!等会看看怎么回事!
----------------------------------------------------更新-------------------------------------------------
# -*- coding: utf-8 -*-
#将多个Excel文件合并成一个
import xlrd
import xlsxwriter
#打开一个excel文件
def open_xls(file):
fh=xlrd.open_workbook(file)
return fh
#获取excel中所有的sheet表
def getsheet(fh):
return fh.sheets()
#获取sheet表的行数
def getnrows(fh,sheet):
table=fh.sheets()[sheet]
return table.nrows
#读取文件内容并返回行内容
def getFilect(file,shnum):
fh=open_xls(file)
table=fh.sheets()[shnum]
num=table.nrows
for row in range(num):
rdata=table.row_values(row)
datavalue.append(rdata)
return datavalue
#获取sheet表的个数
def getshnum(fh):
x=0
sh=getsheet(fh)
for sheet in sh:
x+=1
return x
if __name__=='__main__':
#定义要合并的excel文件列表
allxls=['C:/Users/lihwa11/Desktop/Python/filename/2.xlsx',
'C:/Users/lihwa11/Desktop/Python/filename/4.xlsx','C:/Users/lihwa11/Desktop/Python/filename/34.xlsx',
'C:/Users/lihwa11/Desktop/Python/filename/54.xlsx','C:/Users/lihwa11/Desktop/Python/filename/b4.xlsx']
#存储所有读取的结果
datavalue=[]
for fl in allxls:
fh=open_xls(fl)
x=getshnum(fh)
for shnum in range(x):
print("正在读取文件:"+str(fl)+"的第"+str(shnum)+"个sheet表的内容...")
rvalue=getFilect(fl,shnum)
#定义最终合并后生成的新文件
endfile='demo.xlsx'
wb1=xlsxwriter.Workbook(endfile)
#创建一个sheet工作对象
ws=wb1.add_worksheet()
for a in range(len(rvalue)):
for b in range(len(rvalue[a])):
c=rvalue[a][b]
ws.write(a,b,c)
wb1.close()
print("文件合并完成")
补充链接:https://blog.csdn.net/Together_CZ/article/details/86689272
更新:还有利用pandas来处理的;
import pandas as pd
file1='C:/Users/lihwa11/Desktop/Python/filename/2.xlsx'
file2='C:/Users/lihwa11/Desktop/Python/filename/4.xlsx'
file3='C:/Users/lihwa11/Desktop/Python/filename/34.xlsx'
file=[file1,file2,file3]
li=[]
for i in file:
li.append(pd.read_excel(i))
writer = pd.ExcelWriter('C:/Users/lihwa11/Desktop/Python/filename/output.xlsx')
pd.concat(li).to_excel(writer,'Sheet1',index=False)
writer.save()
#综上所述,还是pandas好用
import pandas as pd
file1='C:/Users/lihwa11/Desktop/Python/filename/a.xlsx'
file2='C:/Users/lihwa11/Desktop/Python/filename/b.xlsx'
file3='C:/Users/lihwa11/Desktop/Python/filename/c.xlsx'
file4='C:/Users/lihwa11/Desktop/Python/filename/d.xlsx'
file5='C:/Users/lihwa11/Desktop/Python/filename/e.xlsx'
dfs = []
for fn in (file1,file2,file3,file4,file5):
dfs.append(pd.read_excel(fn))
df = pd.concat(dfs)
df.to_excel('C:/Users/lihwa11/Desktop/Python/filename/sun.xlsx',index = False)
参考链接 :https://zhuanlan.zhihu.com/p/36031795 对应的数据包