原型:
表中有40列,50000行数据.其中许多行是重复的.我想把重复行找出来,剩下不重复的.
我采用的第一个方法:全选数据--筛选--高级筛选--选择不重复记录--将筛选结果复制到其他位置--确定,结果是其中有几列的数据完全消失.其他一些列中的单元格内容也不见了.
如果上述操作是选择在原有区域显示结果,结果是这样的:有的时候没找全,比如我明白50000条数据中有10000条是重复的.而有时确选出的重复来数据又感觉比较小!
怎样可以通过这种方法筛选出来正确的数据呢?
EXCEL有数据的列
A B C
解决方法
1. F列合并要识别的列,并清空前、后、中间的空格,如输入(F2格):
=SUBSTITUTE(TRIM(A2&B2&C2...)," ","")
将该公式向下填充。
2. 复制F列,选择性粘贴(仅数值)到G列。
3. 全选所有资料,再按G列排序。
4. 在H列输入公式(H2格):
=IF(G2=G1,1," ")
将该公式向下填充。
5. 复制H列,选择性粘贴(仅数值)到I列。
6. 全选所有资料,再按I列排序,有1的为重复的。