目录
1. 使用窗口函数 ROW_NUMBER() 和公用表表达式(CTE)
在处理数据库中的重复数据时,我们常常需要从每组重复记录中提取特定的记录(如最新或最早的记录)。这种需求在实际开发中非常常见,但传统的去重方法往往效率低下且代码复杂。今天,我将通过一个具体的 SQL 查询示例,展示如何使用窗口函数(ROW_NUMBER()
)和公用表表达式(CTE)来高效地实现这一目标。
一、背景介绍
假设我们有一个名为 Bas_Doc
的表,该表存储了文档记录,表结构如下:
字段名 | 数据类型 | 描述 |
---|---|---|
DocRecordID | VARCHAR(50) | 文档记录ID |
RelationKey | VARCHAR(50) | 关联键 |
DocMenuID | VARCHAR(50) | 文档菜单ID |
ParentID | VARCHAR(50) | 父级ID |
CreatedDate | DATETIME | 创建日期 |
CreatedBy | VARCHAR(50) | 创建者 |
ExtStatus | VARCHAR(50) | 扩展状态 |
UpdatedDate | DATETIME | 更新日期 |
我们需要从这个表中提取每组重复记录中最早的记录。重复记录的定义是:具有相同的 RelationKey
、DocMenuID
、ParentID
、CreatedDate
、CreatedBy
和 ExtStatus
的记录。