python脚本(比较两个Excel表格的不同并标记)

python脚本(比较两个Excel表格的不同并标记)


由于最近有用到比较两个Excel数据的不同,数据量较大,就在网上搜索了一下python脚本,发现一个比较好用的,但只能比较单列的不同,且有些函数为旧版函数目前已无法使用,因此重新对该脚本进行了修改,使其可以比较excel表中所有列数的不同内容并标记,记录如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#导入模块 openpyxl
import openpyxl
from openpyxl.styles import PatternFill
from openpyxl.styles import colors
from openpyxl.styles import Font, Color
import copy


#读取excel文件
#括号中的字符串为你要比较的两个excel的路径,注意用“/”
wb_a = openpyxl.load_workbook('G:/Desktop/test.xlsx')
wb_b = openpyxl.load_workbook('G:/Desktop/test1.xlsx')
#定义一个方法来获取表格中某一列的内容,返回一个列表
#将每一列输出为一个列表(temp表示列的名字)
def getIP(wb,temp):
    sheet = wb.active
    ip = []
    for cellobj in sheet[temp]:
        ip.append(cellobj.value)
    return ip
#想比较哪几列就输入那几列的名称
list1 = ['A','B','C','D','E','F','G','H','I']
list2 = []#用于存每列不同的值
differ1 = {}#第一个文件中每列不同的列表组成字典
differ2 = {}#第二个文件中每列不同的列表组成字典
for temp1 in list1:
    #获得ip列表
    ip_a = getIP(wb_a,temp1)
    ip_b = getIP(wb_b,temp1)
    #将两个列表转换成集合
    aa = set(ip_a)
    bb = set(ip_b)
    #找出两个列表的不同行,并转换成列表
    difference = list(aa ^ bb)
    #打印出列表中的元素
    #到这一步,两个表格中不同的数据已经被找出来了
    # for i in difference:
    #     print (i)
    
    #将不同行高亮显示
    #print ("开始第一张表" + "----" *10)
    del list2[0:]
    a = wb_a.active[temp1]
    for cellobj in a:
        if cellobj.value in difference:
            #print (cellobj.value)
            cellobj.font = Font(color=colors.BLACK, italic=True ,bold = True)
            cellobj.fill = PatternFill("solid", fgColor="DDDDDD")
            list2.append(cellobj.value)
    if list2!=[]:
        differ1[temp1]=copy.deepcopy(list2)
    #print ("开始第二张表" + "----" *10)
    del list2[0:]
    b = wb_b.active[temp1]
    for cellobj in b:
        if cellobj.value in difference:
            #print (cellobj.value)
            cellobj.font = Font(color=colors.BLACK, italic=True ,bold = True)
            cellobj.fill = PatternFill("solid", fgColor="DDDDDD")
            list2.append(cellobj.value)
    if list2!=[]:
        differ2[temp1]=copy.deepcopy(list2)

 
print(differ1.items())
print(differ2.items())
wb_a.save('G:/Desktop/a.xlsx')
wb_b.save('G:/Desktop/b.xlsx')

运行后结果如下:

dict_items([('D', ['撒']), ('E', [2])])
dict_items([('D', ['热情改变']), ('E', [20])])

两个文件内容如下图所示:
在这里插入图片描述

参考原文:https://www.bbsmax.com/A/Ae5R21q35Q/

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值