union以指定的条件去重

with temp as(
select a,b,c from t1
union all
select a,b,c from t2
)
select a,b,c
from (select a,b,c,row_number() over (partition by a sort by b,c) rn from temp)
where rn=1
;
根据a列去重

业务场景:工单的去重

数据来源于mysql和es,一个工单在mysql中完成后,同步到es
如果mysql中该条数据没有删除,则会同步两次,在后面的old和new的full outer join中将会导致错误
因此需要在ods层处理该问题
采用窗口函数,按照orderid分区,按照来源排序,如果是重复的,取来源于es的数据

with temp as(

select

orderid ,
ordercreatetime ,
companyId ,
areasid ,
institutionid ,
platfromfiledcode ,
orderlargertype ,
ordersecondtype ,
orderthirdlytype ,
serviceflowalias ,
ordersource ,
ordersourcename ,
orderstatus ,
orderstatusname ,

actualhour ,
urgent ,
supervisenum ,
reworknum ,
importance,

dealuserids ,
dealuserorgids,
'es' as comefrom,
dt

from wfs_order_list_index where dt='$do_date'

union all 

select
id,
create_time,
company_id,
areas_id,
institution_id,
'' as platfromfiledcode,
order_larger_type,
order_second_type,
order_thirdly_type,
'' as serviceflowalias,
order_source,
'' as ordersourcename,
status,
'' as orderstatusname,
actual_hour,
urgent,
supervise_num,
rework_num,
importance,
deal_user_ids,
deal_user_org_ids,
'mysql' as comefrom,
dt

from tbwork_order where dt='$do_date'

)


insert overwrite table ods_order partition(dt)
select 

orderid ,
ordercreatetime ,
companyId ,
areasid ,
institutionid ,
platfromfiledcode ,
orderlargertype ,
ordersecondtype ,
orderthirdlytype ,
serviceflowalias ,
ordersource ,
ordersourcename ,
orderstatus ,
orderstatusname ,

actualhour ,
urgent ,
supervisenum ,
reworknum ,
importance,

dealuserids ,
dealuserorgids,
comefrom,
rn,
dt

 from (
select *,ROW_NUMBER() over(partition by orderid sort by comefrom) as rn from temp
)
where rn=1

https://wenwen.sogou.com/z/q705629911.htm

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 可以使用 `INNER JOIN` 来进行双表查询,使用 `DISTINCT` 来去重。示例代码如下: ``` SELECT DISTINCT table1.column1, table1.column2, table2.column1 FROM table1 INNER JOIN table2 ON table1.column1 = table2.column2; ``` 其中,`table1` 和 `table2` 是要进行查询的两张表,`column1` 和 `column2` 是两张表中相同的列名,用来进行联结,`DISTINCT` 用来去重,可以根据需要选择保留的列名。 ### 回答2: 在 MySQL 中进行双表查询并去重可以通过使用 DISTINCT 关键字来实现。双表查询是指从两个表中同时检索数据的操作。 假设有两个表A和B,我们想要对它们进行联合查询并去重。例如,我们想要从表A和表B中获取所有的客户姓名。首先,我们需要使用 UNION 运算符将两个表的数据合并在一起。UNION 运算符将从表A和表B中检索所有的数据,并且将它们合并为一个结果集。然后,我们可以在查询中使用 DISTINCT 来去除重复的数据。 以下是一个示例查询的代码: ``` SELECT DISTINCT customer_name FROM ( SELECT customer_name FROM tableA UNION SELECT customer_name FROM tableB ) AS combined_table; ``` 在这个例子中,我们首先在子查询中使用 UNION 运算符将表A和表B中的客户姓名合并为一个结果集。然后,我们在外部查询中使用 DISTINCT 关键字来去掉重复的客户姓名。最后,我们将结果集中的客户姓名作为查询的结果返回。 注意,用于合并的列必须是相同的数据类型。如果希望除了姓名还能检索其他列的数据,可以在子查询中包含其他需要的列,并相应地进行调整。 总之,通过使用 UNION 和 DISTINCT 关键字,我们可以在 MySQL 中进行双表查询并去重。 ### 回答3: 在MySQL中进行双表查询并去重可以通过使用DISTINCT关键字来实现。 假设有两个表table1和table2,它们通过某个列进行关联。要进行双表查询并去重,可以使用如下的SQL语句: SELECT DISTINCT column_name FROM table1 INNER JOIN table2 ON table1.column_name = table2.column_name; 其中,column_name是用来进行关联的列的名称。 以上SQL语句的意思是,首先使用INNER JOIN连接table1和table2两个表,连接的条件是两个表中的column_name列的值相等。然后使用DISTINCT关键字来去除查询结果中的重复行,最后只返回不重复的column_name列的值。 这样就可以实现简单的双表查询并去重的操作了。 需要注意的是,在使用DISTINCT关键字时,只会去除查询结果中所有列的完全相同的重复行。如果查询结果中某些列的值相同,但其他列的值不同,那么这些行依然会保留下来。如果需要去除多个列的重复行,可以在DISTINCT关键字后面指定想要去重的列的名称。 另外,还可以使用其他的方法来进行双表查询并去重,比如使用子查询、使用UNION操作符等,具体可以根据实际需求来选择适合的方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值