随着从 postgresql 迁移到达梦数据库的开发工作越来越深入,我们又陆陆续续地遇到了一些棘手的问题。下面我们继续逐个讲解其中比较有意思的方面。
PG 里的 distinct 的神奇之处以及达梦当中类似的变通实现
在使用 pg(postgresql)的时候,我们业务代码中有类似以下这样的用法(为了叙述简便,简化之):
select distinct on (field_1)
*
from table_1
咋一看,这个语句有点神奇。其实这个 distinct on (xxx) ,表示的是依据哪些字段来作为 distinct 的筛选。为什么说它神奇呢?这是因为PG 的引擎太灵活了,因此它可以允许查询出来的列和 作为 distinct 的列 独立开来。这样的话,假设table_1 里面有 field_1 值为 1,1,2,2,3,3 的,那么按上述语句,查询结果只会出现 field_1 分别为1,2,3 的3条记录,至于是哪3条,如果没有特别的筛选,那基本上就是按DB查询时遇到的记录的顺序来。
但是,到了达梦数据库这里,就没有直接对应的 distinct 的语法了。在达梦数据库当中,distinct 的列,和查询的列必须是一体统一的。所以在达梦的语法体系里,要想根据 field_1 的值来做 distinct ,而又想同时查询出其他字段的值,就很麻烦。
幸运的是,在同事的努力之下,发现在达梦数据库中一个变通的方法,如下:
select * from (
select row_number() over (partition by field_1 order by field_1 asc) as row_number_id
,*
from table_1 )
where row_number_id = 1;
通过引入 row_number() 并根据 field_1 生成分组的行号,再通过外面多一层查询去筛选这个分组行号为 1,总算实现了与 PG 一样的效果。
OK,后续遇到什么迁移过程中的疑难杂症,我将在这篇文章中继续补充。
感谢您的阅读,希望上述分享对您有用!