【oracle】— 数据统计—对查出来的数据进行去重方法

本文介绍了在SQL查询中如何处理多表连接后的重复数据问题。通过实例展示了使用groupby和row_number()over函数的方法,确保在去重的同时保留所需的数据。groupby允许按特定字段分组,但可能改变原始排序;而row_number()over则能在保持原有排序的基础上选择第一条记录,对于非数字字段,可能需要转换。这两种方法在数据清洗和处理中十分实用。
摘要由CSDN通过智能技术生成

1. 概述

当多表连接查询多个字段出现重复数据时,我们由于业务需要,大部分时候只需要其中的一条就行了,所以数据去重就格外重要。

2. 简单问题例子

  1. .通过jion 查询出数据
select user.userName,teacher.sex, user.`password` from user JOIN  teacher on user.id = teacher.id 
  1. 结果
    在这里插入图片描述

  2. 目标: 发现userName,password中张三和admin重复了,假设我们只需要其中一条数据,而不去分辨男女

3. 解决方法

3.1使用group by
  1. sql代码
select user.userName,teacher.sex, user.`password` from user JOIN  teacher on user.id = teacher.id group by user.userName,
user.`password`
  1. 结果
    在这里插入图片描述
    但是有时我们进行了group by 会改变原理的排序,并且不能与order by使用,这是另外的一个函数。
3.2 row_number () over
  1. sql代码
select * from
(SELECT
	userName,
	sex,
	PASSWORD,
	USER.id,
	row_number ( ) over ( PARTITION BY userName,PASSWORD ORDER BY USER.id ) as user_rn
	
FROM
	USER JOIN teacher ON USER.id = teacher.id)
	where user_rn = 1

但是如果如果排序的字段不是数字需要进行转化to_number()
这种做法也是通过分组排序后面进行升序或者降序取第一个行数据,但是如果单列也可以只用distinct,详情可以见
distinct使用

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值