利用python实现Excel表格的合并

最新推荐文章于 2024-09-18 11:30:55 发布

WINNER_QIUQIU

最新推荐文章于 2024-09-18 11:30:55 发布

阅读量2.1k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/WINNER_QIUQIU/article/details/109147768

版权

python 专栏收录该内容

18 篇文章 2 订阅

订阅专栏

本文将详细展示利用python合并多Excel多sheet的方法以及代码。

方法：

利用第三方模块，xlsxwriter（用于将数据写入表中）、xlrd（用于读取文件）。一个Excel中有多个Sheet，也需要合并。

正文：

准备需要合并的Excel表格以及要写入的一个空表。此处，分别命名为测试1、测试2。将要写入的表命名为“合并”。将Excel中写入一些信息，进行合并测试的Excel如下图所示：
$\qquad$ Excel1Sheet1： $\qquad$ Excel2Sheet1：
$\qquad$ Excel2Sheet2
最终，经过合并后得到的表格如图：

下面展示具体过程：
$\qquad$ 在开始前，需要导入xlswriter与xlrd模块。可以参考我的另一篇博客。导入第三方模块
导入需要的第三方模块后，执行以下代码即可。

import xlrd,xlsxwriter
#设置要合并的所有文件
allxls = ["F:/python/爬虫/测试Excel/测试1.xls","F:/python/爬虫/测试Excel/测试2.xls"]
#设置合并到的文件
endxls = "F:/python/爬虫/测试Excel/合并.xls"
#打开表格并进行异常处理
def open_xls(file):
    try:
        fh = xlrd.open_workbook(file)        
        return fh    
    except Exception as e:        
        print(str("打开出错，错误为："+e))
#获取所有Sheet
def getsheet(fh):    
    return fh.sheets()
#读取某个Sheet的行数
def getnrows(fh,sheet):    
    table = fh.sheets()[sheet]##    
    content = table.nrows    
    return content
#读取某个文件的内容并返回所有行的值
def getfilect(fh,fl,shnum):    
    fh = open_xls(fl)    
    table = fh.sheet_by_name(shname[shnum])    
    num = getnrows(fh,shnum)    
    lenrvalue = len(rvalue)    
    for row in range(0,num):        
        rdata = table.row_values(row)        
        rvalue.append(rdata)    
        #print(rvalue[lenrvalue:])    
        filevalue.append(rvalue[lenrvalue:])    
        return filevalue
#初始化列表#存储所有读取结果
filevalue = []
#存储一个标签的结果
svalue = []
#存储一行结果
rvalue = []
#存储sheet名
shname = []
#读取第一个待读文件，获取Sheet数
fh = open_xls(allxls[0])
sh = getsheet(fh)
x = 0
for sheet in sh:    
    shname.append(sheet.name)    
    svalue.append([])    
    x+=1
#依次读取各sheet的内容#依次读取各文件当前sheet的内容
for shnum in range(0,x):    
    for fl in allxls:        
        print("正在读取文件，"+str(fl)+"的第"+str(shnum)+"个标签的...")        
        filevalue = getfilect(fh,fl,shnum)    
    svalue[shnum].append(filevalue)    
    #print(svalue[0])    
    #print(svalue[1])
#由于append具有叠加关系，分析可得所有信息均在svalue[0][0]中存储
#svalue[0][0]元素数量为sheet标签数(sn)*文件数(fn)
sn = x
fn = len(allxls)
endvalue=[]
#设置一个函数专门获取svalue里面的数据，即获取各项标签的数据
def getsvalue(k):      
    for z in range(k,k+fn):        
        endvalue.append(svalue[0][0][z])    
    return endvalue
#打开最终写入的文件
wbl = xlsxwriter.Workbook(endxls)
#创建一个sheet工作对象
ws = wbl.add_worksheet()
polit = 0
linenum = 0
#依次遍历每个sheet中的数据
for s in range(0,sn*fn,fn):    
    thisvalue = getsvalue(s)    
    tvalue = thisvalue[polit:]    
    #将一个标签的内容写入新文件中    
    for  a in range(0,len(tvalue)):        
        for b in range(0,len(tvalue[a])):            
            for c in range(0,len(tvalue[a][b])):                
                #print(linenum)                
                #print(c)                
                data = tvalue[a][b][c]                
                ws.write(linenum,c,data)            
            linenum+=1   
    #叠加关系，需要设置分割点    
    polit = len(thisvalue)
wbl.close()