1.新建2个要比较的表 (以SqlServer为例)
Compare_A 和 Compare_B
表中的数据
2. 利用 Union All 和 Group By 所有字段来比较
上图参照脚本
-- 2个表原始数据条数是相同的
SELECT COUNT(*) FROM Compare_A; -- 2
SELECT COUNT(*) FROM Compare_B; -- 2
-- union all 之后,HAVING COUNT(*) = 1 的条数是 0, 代表没有不同的
-- 说明 表中的 每一个单元格内容是一致的
SELECT * FROM(
SELECT * FROM Compare_A
UNION ALL
SELECT * FROM Compare_B
) t
GROUP BY
Id,Name,Age,Birthday
HAVING COUNT(*) = 1 ORDER BY Id;
-- 同时也要验证一下,HAVING COUNT(*) = 2 的数据条数 要 和原始表的数据条数相同
-- 避免出现 行重复的情况,如果有HAVING COUNT(*) > 2 的情况,就说明原始表中的数据有重复
-- 一般都要仔细检查下原始数据是否有问题
SELECT COUNT(*) FROM
(
SELECT * FROM
(
SELECT * FROM Compare_A
UNION ALL
select * from Compare_B
) t
GROUP BY
Id,Name,Age,Birthday
HAVING COUNT(*) = 2
) T2
图中 ② 的条数 为 0; ① 和 ③ 条数执行的结果条数相同 则代表 数据表中 每一个 单元格都是相同的
附录:
Mark1: 尝试过 用Excel 来做实际业务数据的对比,后来放弃了
原因:
1) 列 和 行特别多的时候,无论是标注颜色 还是 提取数据效果都不是很理想
2)对比的维度,查询SQL在不断变化,导出成Excel 再对比,效率不高