如何用Python合并excel表中的重复内容
python操作excel有:xlrd和xlwt,这两个库可以读一个可以写。
当然你可以直接用openpyxl这个库,读写。
代码就是写一个while循环读取每一个条目比较合并。
既然是作业,还是自己写一下,对自己是有好处的。用上面的库可以完成你的需求,你只需要去看看官网怎么用这个库,应该就可以写出来了。
我是喜欢用openpyxl,下面附上官网文档:
openpyxl文档
python如何读取多个excel合并到一个excel中
思路
利用python xlrd包读取excle,将文件内容存入一个列表中利用xlsxwriter将内入到一个新的excel文件中。
完整代码
# -*- coding: utf-8 -*-#将多个Excel文件合并成一个import xlrdimport xlsxwriter#打开一个excel文件def open_xls(file):
fh=xlrd.open_workbook(file) return fh#获取excel中所有的sheet表def getsheet(fh):
return fh.sheets()#获取sheet表的行数def getnrows(fh,sheet):
table=fh.sheets()[sheet] return table.nrows#读取文件内容并返回行内容def getFilect(file,shnum):
fh=open_xls(file)
table=fh.sheets()[shnum]
num=table.nrows for row in range(num):
rdata=table.row_values(row)
datavalue.append(rdata) return datavalue#获取sheet表的个数def getshnum(fh):
x=0
sh=getsheet(fh) for sheet in sh:
x =1
return xif __name__=='__main__': #定义要合并的excel文件列表
allxls=['F:/test/excel1.xlsx','F:/test/excel2.xlsx'] #存储所有读取的结果
datavalue=[] for fl in allxls:
fh=open_xls(fl)
x=getshnum(fh) for shnum in range(x):
print("正在读取文件:" str(fl) "的第" str(shnum) "个sheet表的内容...")
rvalue=getFilect(fl,shnum) #定义最终合并后生成的新文件
endfile='F:/test/excel3.xlsx'
wb1=xlsxwriter.Workbook(endfile) #创建一个sheet工作对象
ws=wb1.add_worksheet() for a in range(len(rvalue)): for b in range(len(rvalue[a])):
c=rvalue[a][b]
ws.write(a,b,c)
wb1.close()
print("文件合并完成")1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162
源文件excel1:
源文件excel2:
运行结果:
合并后的excel3:
用Python导出工程文件两个子页里的数据成为两个excel表格,但我想把它合并成个一个excel表格的两个sheet
可以采用一些操Excel的去实现,比如xlrd、xlwt、openpyxl、xlsxwriter块。xlrd模块主要用于读取Excel表,xlwt与xlsxwriter模块用于将数据写入表中,两个模块任选其一即可,但是xlwt与xlsxwriter模块不支持修改表,所以在信息追加的时候会较麻烦,有些朋友可能这个地方遇到了很大的问题,其实这个问题至少有两种思路解决:
A、换成其他模块,比如openpyxl等,这个模块实现起来会相对简单一些,比如目前已经收到的苏wisdom同学采用的就是这种方法,值得表扬,所以以下方法1会参照苏wisdom同学的答案。此外,截止至目前为止『歹ピ№ㄕ』同学、微雨同学、黄梦颖同学已经提交第二次作业,一并表扬。
B、仍然使用xlwt与xlsxwriter等模块,但是先将每次读取的信息存储到list(列表)中,然后,最后一次写入。这一种方式稍微复杂一些,所以老师在方法2中采用这种方式去写,目的是给大家一个解决方案的参考,有更优的方案可以随时邮箱反馈。
此外,还有一个难点,即一个表格中有多个sheet,我们希望能够用程序自动获取这多个sheet,然后将各sheet中的内容一并写入到最终表格中,目前答案中暂时没有看到解决这个问题,如果大家能解决这个问题,是极好的。各位同学可以参考老师的第二种方法,第二种方式中,考虑了多个sheet的问题,各位也可以对程序进行优化。