Oracle listagg去重distinct的三种方式总结

一、简介

最近在工作中,在写oracle统计查询的时候,遇到listagg聚合函数分组聚合之后出现很多重复数据的问题,于是研究了一下listagg去重的几种方法

以下通过实例讲解三种实现listagg去重的方法。

二、方法

首先还原listagg聚合之后出现重复数据的现象,打开plsql,执行如下sql:

1

2

3

4

5

6

select t.department_name depname,

       t.department_key,

       listagg(t.class_key, ',') within group(order by t.class_key) as class_keys

  from V_YDXG_TEACHER_KNSRDGL t

 where 1 = 1

 group by t.department_key, t.department_name

运行结果:

如图,listagg聚合之后很多重复数据,下面讲解如何解决重复数据问题。

【a】 第一种方法

使用wm_concat() + distinct去重聚合

1

2

3

4

5

6

7

--第一种方法: 使用wm_concat() + distinct去重聚合

select t.department_name depname,

       t.department_key,

       wm_concat(distinct t.class_key) as class_keys

  from V_YDXG_TEACHER_KNSRDGL t

 where 1 = 1

 group by t.department_key, t.department_name

如上图,listagg聚合之后没有出现重复数据了。oracle官方不太推荐使用wm_concat()来进行聚合,能尽量使用listagg就使用listagg。

【b】第二种方法

使用正则替换方式去重(仅适用于oracle字符串大小比较小的情况)

1

2

3

4

5

6

7

8

9

--第二种方法:使用正则替换方式去重(仅适用于oracle字符串大小比较小的情况)

select t.department_name depname,

       t.department_key,

       regexp_replace(listagg(t.class_key, ',') within

                      group(order by t.class_key),

                      '([^,]+)(,\1)*(,|$)',

                      '\1\3') as class_keys

  from V_YDXG_TEACHER_KNSRDGL t

 group by t.department_key, t.department_name;

这种方式处理listagg去重问题如果拼接的字符串太长会报oracle超过最大长度的错误,只适用于数据量比较小的场景。

【c】第三种方法

先去重,再聚合(推荐使用)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

--第三种方法:先去重,再聚合

select t.department_name depname,

       t.department_key,

       listagg(t.class_key, ',') within group(order by t.class_key) as class_keys

  from (select distinct s.class_key, s.department_key, s.department_name

          from V_YDXG_TEACHER_KNSRDGL s) t

 group by t.department_key, t.department_name

  

--或者

select s.department_key,

       s.department_name,

       listagg(s.class_key, ',') within group(order by s.class_key) as class_keys

  from (select t.department_key,

               t.department_name,

               t.class_key,

               row_number() over(partition by t.department_key, t.department_name, t.class_key order by t.department_key, t.department_name) as rn

          from V_YDXG_TEACHER_KNSRDGL t

         order by t.department_key, t.department_name, t.class_key) s

 where rn = 1

 group by s.department_key, s.department_name;

推荐使用这种方式,先把重复数据去重之后再进行聚合处理。

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Oracle中,可以使用listagg函数将多行数据合并成一行,并且可以指定分隔符。然而,当使用listagg函数时,可能会出现重复数据的问题。为了解决这个问题,可以采用以下几种方法: 1. 使用DISTINCT关键字:在listagg函数内部使用DISTINCT关键字可以去除重复的数据。例如: SELECT listagg(column_name, ',') WITHIN GROUP (ORDER BY column_name) FROM table_name; 2. 使用子查询去重:可以使用子查询来先去除重复的数据,然后再使用listagg函数进行合并。例如: SELECT listagg(column_name, ',') WITHIN GROUP (ORDER BY column_name) FROM (SELECT DISTINCT column_name FROM table_name); 3. 使用正则表达式替换:可以使用正则表达式替换函数regexp_replace来去除重复的数据。例如: SELECT regexp_replace(listagg(column_name, ',') WITHIN GROUP (ORDER BY column_name), '(\[^,\]+)(,\1)+', '\1') FROM table_name; 这些方法可以根据具体的需求选择使用,以实现在listagg函数中去除重复数据的目的。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *2* [Oracle listagg去重distinct三种方法总结](https://blog.csdn.net/Weixiaohuai/article/details/84998212)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [oraclelistagg() 函数及数据的去重!!](https://blog.csdn.net/qq_45498460/article/details/118545865)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sinat_40572875

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值