mysql merge oracle_如何协助 MySQL 实现 Oracle 高级分析函数

Oracle 支持一些独特的语法和函数,在移植到 MySQL 上时或多或少给程序员造成了困扰,下面我们针对 Oracle 的一些特殊用法举例并讲解如何用集算器来完成同样功能。这些方法当然也不限于针对 MySQL,对于所有其它数据库也能支持。

1、 递归语句

a) select employee_id,first_name,last_name,manager_id

from hr.employees

start with employee_id=102

connect by prior employee_id = manager_id

3383e3fc9cb532824a4781b7aede75ad.png

(1) A3 设置序表 A2 的键

(2) A4 选取起始雇员

(3) A5 将 A2 中 MANAGER_ID 值转换成记录,以便递归

(4) A6 获取起始雇员的所有子节点

a87dc270fca0c17e1c723e065b1ad480.png

b) select employee_id, first_name,last_name,manager_id

from hr.employees

start with employee_id=104

connect by prior manager_id = employee_id

d0469d8a94dc5450fe10d4ca00284fa7.png

(1) A6 获取起始雇员的所有父节点

55bcbab5b4bbae56570d2c95319e2345.png

c) select employee_id,last_name,manager_id,sys_connect_by_path(last_name,'/') path from hr.employees

start with employee_id=102

connect by prior employee_id = manager_id

bcd1b7ec75c804730498128216a19855.png

(1) 由于 A7 中每条记录的父节点都在本节点之前,故 A8 可以从前往后对 A7 中每条记录依次修改 PATH 值

622ce56824c7b437a5560eb087124f32.png

2、 嵌套聚集函数

select avg(max(salary)) avg_max, avg(min(salary)) avg_min

from hr.employees

group by department_id

633d792532e3aeea4d45560039383881.png

(1) A2 中 A1.query 也可以改用 A1.cursor

57769297f0a1ae206ec2131893004560.png

3、 聚集分析函数 FIRST 和 LAST

SELECT department_id,

MIN(salary) KEEP (DENSE_RANK FIRST ORDER BY commission_pct) worst,

MAX(salary) KEEP (DENSE_RANK LAST ORDER BY commission_pct) best

FROM hr.employees

GROUP BY department_id

ORDER BY department_id

df92fb37aaa6dd4e2e58b3c19e95b013.png

(1) A2 已按 DEPARTMENT_ID 排序,则 A3 分组时可采用 group@o

(2) FIRST/LAST 取排序的后第一组 / 最后一组,而 Oracle 排序时 null 排在最后,所以 LAST 会取到的最后一组就是 null 值所在组。maxp/minp 求具有最大值 / 最小值的所有行时排除了 null,所以在 A4 是用 ifn(COMMISSION_PCT,2) 保证 null 值时最大

(3) A5 中,DEPARTMENT_ID=null 时采用采用比所有 DEPARTMENT_ID 都大的 power(2,32) 来保证这一行排在最后

如果数据量大,还可以采用游标方式。

9c33040fb19ffdba540eee73db10f6f5.png

(1) A3 中,min([if(COMMISSION_PCT,2), SALARY]) 求出 COMMISSION_PCT 最小时的 SALARY 最小值,即 COMMISSION_PCT 排名第一时 SALARY 最小值,max 类似

5ce6e4b72604393bb9b279837ba6432a.png

4、 占比函数 ratio_to_report

a) SELECT last_name, salary, RATIO_TO_REPORT(salary) OVER () AS rr

FROM hr.employees

WHERE job_id = 'PU_CLERK'

ORDER BY last_name

91255c89fa6f339ae857b849ef7964e6.png

f2c81d9800bd6f5feb5b6b44f7338582.png

b) SELECT department_id,last_name, salary, RATIO_TO_REPORT(salary) OVER (partition by department_id) AS rr

FROM hr.employees

WHERE department_id in (20,60)

ORDER BY department_id,last_name

7757b5210794050359986e0cc516a522.png

(1) A2 中已按 DEPARTMENT_ID 排序,则 A3 可用 groups@o 分组聚集

4948036e4028d9f70ef7f61d14818f22.png

5、 多重分组

SELECT department_id, job_id, sum(salary) total

FROM hr.employees

WHERE department_id in (30, 50)

GROUP BY grouping sets((department_id, job_id), department_id)

0d323f57d8fa2875cf525f2e4818ad38.png

(1) 因为 A3 和 A4 均对 DEPARTMENT_ID 有序,故 A5 可 merge,ifn(JOB_ID,fill("z",10))) 用来保证 JOB_ID 为 null 排在后面

也可以采用游标方式。

13c973bdcc3d939a97fce8ca833ab9c5.png

(1) A3 中 A2.group 要求 A2 对 DEPARTMENT_ID 有序

(2) A4 对 A3 每一组求和并将结果插入此组末尾

还可以采用管道方式。

77e0ee5ba4000315bb6f9516bc844ee9.png

(1) A3 创建管道,并附加分组求和

(2) A4 将 A2 中数据推送到 A3,注意此动作只有在 A2 中数据有实际取出行为才执行

(3) A5 创建管道,并附加分组求和

(4) A6 将 A3 结果推送到 A5,此处也可以直接将 A2 中数据推送到 A5,但会增加时间复杂度

(5) A7 保留 A3 的数据

(6) 循环读取 A2,每次只取 1000 条,减少内存占用

(7) A10 对 A3 和 A5 中数据排序,因为算法是稳定的,所以 JOB_ID 为 null 的排在后面

37e3f3b0bb209d20cdf4f348c302fda5.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值