有时候业务中会遇到更新了一些修改文档,但是不知道哪里被修改了,所以我写了这个脚本,专门找表格的不同!下面直接上代码
import pandas as pd
# 步骤1: 读取两个Excel文件
df1 = pd.read_excel(r'C:\Users\admin\Desktop\T分数常模\比较1.xlsx')
df2 = pd.read_excel(r'C:\Users\admin\Desktop\T分数常模\比较2.xlsx')
# 步骤2: 确保两个DataFrame的形状相同,这对比较来说很重要
if df1.shape == df2.shape:
# 步骤3: 遍历每一列,比较两个DataFrame中的值
for column in df1.columns:
# 找出不同的地方并打印出来
diff_locations = df1.index[df1[column] != df2[column]].tolist()
if diff_locations:
for row in diff_locations:
val1 = df1.at[row, column]
val2 = df2.at[row, column]
# 检查两个值是否都是NaN,如果是,则不认为这是一个差异
if pd.isna(val1) and pd.isna(val2):
continue
print(f"第 {row+1} 行, 列 '{column}' 存在差异:")
print(f"旧文件中的值: {val1}")
print(f"新文件中的值: {val2}")
else:
print("两个表格的形状不同,无法比较。")
结果正确: