mysql date max,mysql – 使用MAX DATE和GROUP BY获取行

我的表名为payment_schedule,内容如下

ee1d204b83b96d14f1b7f31b9959ad88.png

我想用MAX(due_date)GROUPED BY loan_application_id获取记录

参考上面图像中的记录,我希望结果如下

3a3040dcde057f232bfa70efa166f2df.png

我尝试使用以下SQL查询

SELECT

id,

MAX(due_date) as due_date,

loan_application_id

FROM

payment_schedule

GROUP BY

loan_application_id

这返回给我以下结果.

9484942d34805eff6da5c7c46e0a587a.png

如您所见,它不会返回给定截止日期的相应ID.

另外,我有另一个名为payment_type_id的列,当payment_type_id的值为3时,我需要排除行.

我在这里尝试了几种解决方案,似乎没什么用,怎么去呢?

谢谢.

解决方法:

这称为Group-wise Maximum,在此标记为greatest-n-per-group.最传统的方法是找到所需的值并进行连接以获得每组的相应行,如下所示:

SELECT

ps.id,

ps.due_date,

ps.loan_application_id

FROM

(

SELECT

MAX(due_date) as due_date,

loan_application_id

FROM payment_schedule

WHERE payment_type_id != '3'

GROUP BY loan_application_id

) ps2

LEFT JOIN payment_schedule ps USING (loan_application_id)

WHERE ps.due_date = ps2.due_date

AND ps.payment_type_id != '3'

GROUP BY ps.loan_application_id

还值得一提的是,如果您的loan_application_id和due_date列上有索引,则此查询的运行速度将快上百倍.

标签:mysql,database,greatest-n-per-group,greatest-n-per-group

来源: https://codeday.me/bug/20190609/1202129.html

### 如何利用索引优化 MySQL `GROUP BY` 查询性能 #### 使用覆盖索引来加速 `GROUP BY` 当执带有 `GROUP BY` 的查询时,如果可以创建一个包含所有所需列的联合索引,则数据库引擎可以直接从索引树中读数据而无需访问实际的数据页。这种技术称为覆盖索引[^2]。 例如,在表 `orders` 中有三列分别是 `customer_id`, `product_name`, `amount` 并且经常按 `customer_id` 进分组统计销售总额: ```sql CREATE INDEX idx_customer_product_amount ON orders (customer_id, product_name, amount); ``` 这样做的好处是在做如下查询的时候能够显著提高效率: ```sql SELECT customer_id, SUM(amount) AS total_sales FROM orders WHERE order_date BETWEEN 'start-date' AND 'end-date' GROUP BY customer_id; ``` #### 排序与 `GROUP BY` 结合使用 对于既需要排序又需要分组的情况,应该考虑让索引顺序匹配 `ORDER BY` 或者 `GROUP BY` 子句中的字段列表及其方向(升序或降序)。这有助于减少额外的文件排序操作并加快查询速度[^3]。 假设有一个需求是要获取每个客户的最新订单日期以及对应的金额总: ```sql ALTER TABLE orders ADD INDEX idx_orderdate_custid_amt (order_date DESC, customer_id, amount); SELECT o.customer_id, MAX(o.order_date), SUM(o.amount) FROM orders o GROUP BY o.customer_id ORDER BY o.order_date DESC; ``` 这里定义了一个复合索引 `(order_date DESC, customer_id, amount)` 来支持上述查询的需求。 #### 减少不必要的回表查找 尽可能地使所选索引成为聚集索引或者是能完全满足查询条件的辅助索引,从而避免因缺少某些列而导致的二次查表现象。特别是对于大容量表格而言,过多的随机I/O会严重影响整体性能[^4]。 比如下面的例子展示了如何构建适合特定场景下的索引结构来防止回表: ```sql -- 假设我们总是按照 user_id 分组,并且只关心 count(*) sum(points),那么我们可以建立这样的索引: CREATE INDEX idx_user_points_count ON users(user_id, points); -- 对应的高效查询可能是像这样的形式: SELECT u.user_id, COUNT(*), SUM(u.points) FROM users u GROUP BY u.user_id; ``` 通过合理设计索引策略,可以在很大程度上改善涉及 `GROUP BY` 操作的 SQL 语句的表现效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值