如何用python从excel中同时提取两个列的数据,并生...
利用python xlrd包读取excle文件,然后将文件内容存入列表中,再利用xlsxwriter将内容写一个新的excel文件
完整代码
# -*- coding: utf-8 -*-#将多个Excel文件合并成一个import xlrdimport xlsxwriter#打开一个excel文件def open_xls(file):
fh=xlrd.open_workbook(file) return fh#获取excel中所有的sheet表def getsheet(fh):
return fh.sheets()#获取sheet表的行数def getnrows(fh,sheet):
table=fh.sheets()[sheet] return table.nrows#读取文件内容并返回行内容def getFilect(file,shnum):
fh=open_xls(file)
table=fh.sheets()[shnum]
num=table.nrows for row in range(num):
rdata=table.row_values(row)
datavalue.append(rdata) return datavalue#获取sheet表的个数def getshnum(fh):
x=0
sh=getsheet(fh) for sheet in sh:
x =1
return xif __name__=='__main__': #定义要合并的excel文件列表
allxls=['F:/test/excel1.xlsx','F:/test/excel2.xlsx'] #存储所有读取的结果
datavalue=[] for fl in allxls:
fh=open_xls(fl)
x=getshnum(fh) for shnum in range(x):
print("正在读取文件:" str(fl) "的第" str(shnum) "个sheet表的内容...")
rvalue=getFilect(fl,shnum) #定义最终合并后生成的新文件
endfile='F:/test/excel3.xlsx'
wb1=xlsxwriter.Workbook(endfile) #创建一个sheet工作对象
ws=wb1.add_worksheet() for a in range(len(rvalue)): for b in range(len(rvalue[a])):
c=rvalue[a][b]
ws.write(a,b,c)
wb1.close()
print("文件合并完成")1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162
源文件excel1:
源文件excel2:
运行结果:
合并后的excel3:
python如何读取多个excel合并到一个excel中
利用python xlrd包读取excle文件,然后将文件内容存入列表中,再利用xlsxwriter将内容写一个新的excel文件
完整代码
# -*- coding: utf-8 -*-#将多个Excel文件合并成一个import xlrdimport xlsxwriter#打开一个excel文件def open_xls(file):
fh=xlrd.open_workbook(file) return fh#获取excel中所有的sheet表def getsheet(fh):
return fh.sheets()#获取sheet表的行数def getnrows(fh,sheet):
table=fh.sheets()[sheet] return table.nrows#读取文件内容并返回行内容def getFilect(file,shnum):
fh=open_xls(file)
table=fh.sheets()[shnum]
num=table.nrows for row in range(num):
rdata=table.row_values(row)
datavalue.append(rdata) return datavalue#获取sheet表的个数def getshnum(fh):
x=0
sh=getsheet(fh) for sheet in sh:
x =1
return xif __name__=='__main__': #定义要合并的excel文件列表
allxls=['F:/test/excel1.xlsx','F:/test/excel2.xlsx'] #存储所有读取的结果
datavalue=[] for fl in allxls:
fh=open_xls(fl)
x=getshnum(fh) for shnum in range(x):
print("正在读取文件:" str(fl) "的第" str(shnum) "个sheet表的内容...")
rvalue=getFilect(fl,shnum) #定义最终合并后生成的新文件
endfile='F:/test/excel3.xlsx'
wb1=xlsxwriter.Workbook(endfile) #创建一个sheet工作对象
ws=wb1.add_worksheet() for a in range(len(rvalue)): for b in range(len(rvalue[a])):
c=rvalue[a][b]
ws.write(a,b,c)
wb1.close()
print("文件合并完成")1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162
源文件excel1:
源文件excel2:
运行结果:
合并后的excel3:
python批处理多个excel文件,得出所有excel文件中...
import openpyxl
filename = 'test.xlsx'
wb = openpyxl.load_workbook(filename)
ws = wb.active
# 遍历出整个数据
# 下面第一个一是表第一行开始,如果想从第二行,为二
# ws.max_row 为该表格的最大行数;ws.max_column 为最大列数
for a in range(1, ws.max_row 1):
for b in range(1, ws.max_column 1):
value = ws.cell(row=a, column=b).value
print(value, end=' ')
print()
ws.close()
wb.close()
如何用python把多个excel文件自动合并到一个文件中
工作中经常Excel,很多事情都重复处理,比如每日报,每周的周报,各种数据表,这定的表其实都是性的劳动。最近这段时间一直在学python,但是断断续续的,眼高手低,看别人的代码看的很懂,但是自己就是写不出来,决定自己写个小程序练练手,解决下身边的实际问题,提高工作效率。
这个小脚本主要是把多个excel文件合并到一个文件中。网上搜索了下文章,有不少excel的python库,最后选择了适合python3的openpyxl库,这个库安装很简单,
pip install openpyxl
开发的环境是:mac/win python3.5 pycharm
废话不多说,把代码贴出来,请大家多指点下,我觉着代码还可以更简洁下,如果大家有好的优化方案麻烦留言指导下:
#coding=gbkimport openpyxlexcel_data=['qihu.xlsx','baidu.xlsx']# new=openpyxl.load_workbook('all.xlsx')for excel_name in excel_data:
wb= openpyxl.load_workbook(excel_name,data_only=True)
sheet_name=wb.get_sheet_names()
# print(sheet_name)
for work in sheet_name:
nb = openpyxl.load_workbook('all.xlsx',data_only=True)
newsheet_name = nb.get_sheet_names()
if work in newsheet_name :
name = nb.get_sheet_by_name(work)
sheet = wb.get_sheet_by_name(work)
for i in range(1,sheet.max_row 1):
for j in range(1,sheet.max_column 1):
# 获取整个sheet数据
data=sheet.cell(row=i,column=j).value
name.cell(column=j,row=i).value=data
else:
newsheet = nb.create_sheet(title=work)
name = nb.get_sheet_by_name(work)
sheet = wb.get_sheet_by_name(work)
for i in range(1,sheet.max_row 1):
for j in range(1,sheet.max_column 1):
# 获取整个sheet数据
data=sheet.cell(row=i,column=j).value
name.cell(column=j,row=i).value=data
print(name)
nb.save('all.xlsx')
# print(newsheet_name)
如何用python合并两个excel表格
思路:
首先读个Excel的首行,对比那些然后分别所在的index也就是列
然后把原始数据中找到和模板一样的数据整列读取,存入对应模板的index即可。基本简单了解下xlwr,xlrd或者是pandas的用法就能搞