我们在做数据分析时有时候要借助excel来帮助我们处理数据,虽然写代码能判断所有情况,但是掌握一些excel的技能会让我们处理起来更快捷。
这里记录一些常用到的处理技巧,这次记录的是
找出两列数据(单列无重复)中的重复项并知道不重复部分的来源。
我们的需求是 有两列数据,这两列都可以去重,也就是本身没有重复。
我们需要知道它们之间相互的重复项,以及哪些是独有的项。
我这里通过用wps的找重复项和颜色属性排序来处理可以很快实现。步骤如下:
如图 我们有两列数据
首先要确保单列无重复(不然使用识别重复功能会有本身重复的项目混进 相互重复的项目中区分不出来)
选中A列 然后在数据栏点击删除重复项(单列去重)
C列也一样的操作 单列去重。
两列都去重之后给C列的字体染个颜色(用于区分哪些是C列独有的项目)
然后把C列粘贴到A列下面合并成一列
把C列剪切到A列下合并成一列。
然后点击数据栏的 设置重复高亮
这样 重复的项就会有背景色了。
我们在把项目根据背景色排序
我们就可以看到如果是红色但没背景色的 则是C列独有的。
如果是黑色没有背景色的 则是A列独有的。
有背景色的为双方的相互重复项。