![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DuckDB开源项目
文章平均质量分 94
本专栏介绍DuckDB开源项目相关知识
Wumbuk
了却君王天下事,赢得生前身后名
展开
-
DuckDB 中的并行分组聚合
GROUP BY更改结果集基数 - 而不是返回相同数量的输入(如正常),返回与数据中组一样多的行数。考虑这个(非常熟悉的)示例查询:SELECTGROUP BYSELECTFROMlineitemGROUP BYGROUP BY后面跟有两个列名,l_returnflag和l_linestatus。这些是用于计算组的列,生成的表将包含数据中出现的同一列的所有组合。我们将GROUP BY子句中的列称为“分组列”,将其中所有值的组合称为“组”。原创 2024-03-31 19:14:20 · 1056 阅读 · 0 评论 -
DuckDB 中的外部聚合
与大多数数据库系统(即服务器)不同,DuckDB 用于各种环境,这些环境可能没有太多内存。但是,某些数据库查询(如具有许多唯一组的聚合)需要大量内存。我写这篇文章的笔记本电脑有 16 GB 的 RAM。如果查询需要 20 GB,该怎么办?查询将中止。可悲的是,我们无法下载更多RAM。但幸运的是,这款笔记本电脑还具有 1 TB 存储空间的快速 SSD。在许多情况下,我们不需要将所有 20 GB 的数据同时存储在内存中,我们可以暂时将一些数据存储在存储中。如果我们在需要时将其加载回去,我们仍然可以完成查询。原创 2024-03-31 18:59:39 · 1315 阅读 · 0 评论