[数据分析小技能]如何处理令人头疼的重复数据?

目录

1.找出重复数据

 2.删除重复数据

1.这一列只要有重复直接删除,随便保留其中一条数据即可

 2.多列重复,当两列同时重复时,才删除该行数据

 3.根据给定条件,删除重复项


        处理重复数据是数据分析中的一项常见任务,因为重复数据会影响数据的准确性和分析结果的有效性。就像是在找朋友聚会的地点时,如果收到了三个朋友发来的相同地址,你可能就会很疑惑:这个地址到底是不是对的呢?这时候你就需要去核实是否有重复的信息。处理重复数据和核实地址类似,都需要你花费额外的时间和精力,但却是确保数据质量的关键步骤。

        所以,处理重复数据还是挺头疼的,但是不解决这个问题,你就可能会像聚会迟到的人一样,错过一些重要的东西。

        那如何处理重复值?接下来我以下面几种情况给大家分享一下我的一点小经验

1.找出重复数据

--1.请你在Excel表格中查找学号中的重复值

找出重复值还是很方便的,我们可以做如下操作:

1)打开 Excel 文件,并选中要查找的数据范围

2)在“开始”选项卡中,选择“条件格式”

3)在下拉菜单中,选择“突出显示单元格规则”,然后选择“重复值”

4)在“重复值格式设置”对话框中,选择要突出显示的颜色,并选择“确定”

5)Excel 将突出显示所有重复的数据,你可以根据需要进行删除、合并或标记重复数据等操作

 -2.请统计一下那一列有多少条数据是重复的

可以借助数据透视表来实现,数据透视是一个非常好的分析工具

1)选中数据列

2)点击【插入】选项卡,选择【数据透视表】

3)【现有工作表】-- 【指定一个单元格位置】

4)将学号拖至【行】

5)将学号拖至【值】-- 选择计数

6)对计数结果进行,排序

 2.删除重复数据

找到重复的值后,我们应该如何删除这些重复的值呢?可能会有下面几种情况:

1.这一列只要有重复直接删除,随便保留其中一条数据即可

题目中直接删除学号这一列,

1)选中数据区域

2)点击[数据]选项卡

3)选择[删除重复值]

4)若弹出删除重复项警告,选择[扩展到选定区域]

5)取消全选,选择要删除的那一列

6)点击确定按钮

 2.多列重复,当两列同时重复时,才删除该行数据

 步骤和上面是一样的,只是选择列时,需要选择“姓名”、“学号”两列

 3.根据给定条件,删除重复项

1.从下单时间中提取日期一列,因为只保留商品名称在一天中的一条记录,所以要提取日期
2.先把下单时间修改成标准的日期格式,利用自定义格式实现
3.对商品名称 下单时间进行自定义排序,商品名称作为主要关键字,下单时间为次要关键字,下单时间必须为降序,多列排序的主次功能如下:
先按照商品名称进行排序,如果商品名称重复,则按照下单时间进行排序
4.通过对商品名称和日期的进行删除重复项操作
5.通过观察测试,删除重复项的操作默认是保留第一条数据,若发现跟上一条有重复会删除,因此,利用降序排序可以把当天中的最晚的那条数据保留,实现想要的效果。  

好了,今天就到这里吧,有问题的小伙伴可以留言,只要本人看到会第一时间回复,请不要吝啬你的关注、收藏哦,一起加油吧! 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

布丁_码到成功

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值