Excel合并列相同的表时处理重复数据

本文介绍了如何使用esProc SPL处理Excel文件中的重复数据。通过两个示例,展示了如何在整行重复和关键列重复的情况下,分别实现只保留一条记录、只保留非空记录以及删除重复数据的操作。示例脚本详细说明了处理过程,适用于数据分析场景。
摘要由CSDN通过智能技术生成

重复数据分为以下两种情况:

1、整行重复

2、关键列重复

在处理重复数据时,又有以下三种情况:

1、只保留相同记录的其中一条

2、只保留不为空的记录

3、去掉所有重复数据

举例

例1【整行重复,去掉所有重复数据】

有 Excel 文件 600.xlsx,部分数据如下所示:

有 Excel 文件 100.xlsx,部分数据如下所示:

100.xlsx的数据是 600.xlsx 的子集

现在需要将 600.xlsx 中将出现在 100.xlsx 中的数据删除,结果如下:

编写 SPL 脚本:

A
1 =file("
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值