基于python 获取两表之间相互不存在的数据或差异的数据

import pandas as pd

# 读取两个 Excel 文件
excel_a = pd.read_excel('test1.xlsx', engine='openpyxl')
excel_b = pd.read_excel('test2.xlsx', engine='openpyxl')

# 按行合并两个数据框
merged_data = pd.merge(excel_a, excel_b, how='outer', indicator=True)

# 筛选出只在一个表中出现的行或数据不一致的行
differences = merged_data[merged_data['_merge'] != 'both']

# 添加列标识差异数据来自于哪个表
differences['Source_Table'] = differences['_merge'].map({'left_only': 'Table A', 'right_only': 'Table B'})

# 将差异数据写入新的 Excel 表
differences.to_excel('path_to_differences.xlsx', index=False)

print(f"差异数据已写入 'path_to_differences.xlsx'")

注:需要安装pandas 以及openpyxl包

  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值