groupBy和orderBy的替代方案

一、背景

相关的设备状态数据

在开发的时候遇到一个需求,需要根据device_code将数据分组,同时获得每组数据中最新的一条数据。

二、遇到的问题
2.1 最初的思路:先对数据进行orderBy 再进行groupBy
 sql语句:
 sql: SELECT * from y_device_events ORDER BY created_at DESC GROUP BY device_code

结果: 这种写法会报错,当groupBy和orderBy组合使用的时候,必须要先进性groupBy在进行orderBy。

2.2 进阶思路:对数据进行orderBy的结果作为临时表,再对临时表分组
 sql语:
 sql:SELECT * from (SELECT * from y_device_events ORDER BY created_at DESC) as new_table GROUP BY new_table.device_code 

结果:这条语句执行了,但是结果并没有按照预期的将最新的一条筛选出来

三、最终的解决方案
3.1 初级方案

通过之前两种方案发现直接使用orderBy和groupBy并不能达到目的,最后觉得可以和自身作关联查询,通过关联查询进行筛选。

SELECT
`y_device_events`.*
FROM
`y_device_events`
LEFT JOIN `y_device_events` AS `new_table` ON `y_device_events`.`device_code` = 
`new_table`.`device_code`
AND `y_device_events`.`created_at` < `new_table`.`created_at`
WHERE
`new_table`.`created_at` IS NULL

这种方法通过左关联查询,对笛卡尔积进行了筛选,就可以达到我们的目的。

3.2 缺点:对于数据量特别大的情况,如果没有限制条件,得到的笛卡尔积会很大,所以查询速度较慢。
3.3 最终的写法

我的需求中可以加上对type及sub_type的限制,因此稍微可以加快一下数据的筛选,而且如果有数据筛选条件,可以将条件放入JOIN语句里面,而不是join完成的where里

 SELECT
  `y_device_events`.*
FROM
  `y_device_events`
LEFT JOIN `y_device_events` AS `new_table` ON `y_device_events`.`device_code` = 
`new_table`.`device_code`
AND `y_device_events`.`created_at` < `new_table`.`created_at`
AND `y_device_events`.`type` = `new_table`.`type`
AND `y_device_events`.`sub_type` = `new_table`.`sub_type`
AND `y_device_events`.`type` = `2`
AND `y_device_events`.`sub_type` = `1`
WHERE
 `new_table`.`created_at` IS NULL
AND `y_device_events`.`created_at` > '2018 - 07 - 05 10 : 07 : 27'
AND `y_device_events`.`created_at` < '2018 - 07 - 05 11 : 04 : 27'
AND `y_device_events`.`result_code` = '-1'

加入筛选条件后,可以大大加快查询的效率。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值