多个xlsx的提取及去重,保存

"""
使用openpyxl对xlsx进行操作,目的是读取多个xlsx保存成一个,每个xlsx只有一个sheet。
sheet中第一行为标题,只保留一个,后面重复的行也只保留一个,保存为xlsx。
如果需要读取一个xlsx的所有表格sheets = wb.get_sheet_names(),再for


"""




import os

#Workbook新建一个xlsx
from openpyxl import Workbook
wb2 = Workbook()
ws2 = wb2.active

path='C:\\Users\\lenovo\\Documents\\Tencent Files'
lists=os.listdir(path)
""""""

#提取所有xlsx文件名称
temp=[]
for x in lists:
    prefix,suffix=os.path.splitext(x)
    if(suffix=='.xlsx'):
        temp.append(x)


#load_workbook打开xlsx
from openpyxl import load_workbook



#把共有的第一行加入ws2
wb = load_workbook(path+'\\'+temp[0])
sheet = wb["Sheet2"]
for row in sheet.iter_rows():
    ws2.append([cell.value for cell in row])
    break



#se存储第3列(主键),不重复的加入ws2
se=set()
for x in temp:
    wb = load_workbook(path+'\\'+x)
    sheet = wb["Sheet2"]
    
    i=1
    for row in sheet.iter_rows():
        if(i==1):
            i+=1
            continue
        if row[0].value!=None:
            if row[2].value not in se:
                se.add(row[2].value)
                ws2.append((cell.value for cell in row))
    
    wb.close()
    print()  

ws2.title="Sheet2"
wb2.save("C:\\Users\\lenovo\\Desktop\\3.31.xlsx")
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值