重复数据分为以下两种情况:
1、整行重复
2、关键列重复
在处理重复数据时,又有以下三种情况:
1、只保留相同记录的其中一条
2、只保留不为空的记录
3、去掉所有重复数据
举例
例1【整行重复,去掉所有重复数据】
有 Excel 文件 600.xlsx,部分数据如下所示:
有 Excel 文件 100.xlsx,部分数据如下所示:
100.xlsx的数据是 600.xlsx 的子集
现在需要将 600.xlsx 中将出现在 100.xlsx 中的数据删除,结果如下:
编写 SPL 脚本:
A | |
---|---|
1 | =file(" |