Clickhouse 数组函数 高阶函数

本文详细介绍了ClickHouse数据库中与数组操作相关的各种函数,包括直接和间接与数组相关的共69个函数。涵盖了数组创建、操作、计算及高级函数如arrayMap、arrayFilter等,并提供了函数的功能说明和用法示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 数组函数的概述:

Clickhouse> select version();

SELECT version()

┌─version()───┐
│ 20.8.1.4447 │
└─────────────┘

1 rows in set. Elapsed: 0.003 sec. 

Clickhouse> select * from system.functions where name like '%arr%';

SELECT *
FROM system.functions
WHERE name LIKE '%arr%'

┌─name──────────────────────┬─is_aggregate─┬─case_insensitive─┬─alias_to─┐
│ arrayJoin                 │            0 │                0 │          │
│ arraySplit                │            0 │                0 │          │
│ arrayExists               │            0 │                0 │          │
│ arrayDifference           │            0 │                0 │          │
│ arrayCumSumNonNegative    │            0 │                0 │          │
│ arrayReverseSplit         │            0 │                0 │          │
│ arrayCount                │            0 │                0 │          │
│ arrayMap                  │            0 │                0 │          │
│ arrayPushFront            │            0 │                0 │          │
│ arrayReduce               │            0 │                0 │          │
│ arrayReverseSort          │            0 │                0 │          │
│ arrayFilter               │            0 │                0 │          │
│ arrayZip                  │            0 │                0 │          │
│ arrayReverseFill          │            0 │                0 │          │
│ arrayFill                 │            0 │                0 │          │
│ arraySlice                │            0 │                0 │          │
│ arrayResize               │            0 │                0 │          │
│ arrayStringConcat         │            0 │                0 │          │
│ arrayAll                  │            0 │                0 │          │
│ arrayCompact              │            0 │                0 │          │
│ arrayConcat               │            0 │                0 │          │
│ arraySum                  │            0 │                0 │          │
│ arrayWithConstant         │            0 │                0 │          │
│ arrayPopFront             │            0 │                0 │          │
│ arrayFirst                │            0 │                0 │          │
│ arrayFirstIndex           │            0 │                0 │          │
│ arrayDistinct             │            0 │                0 │          │
│ arrayUniq                 │            0 │                0 │          │
│ arrayCumSum               │            0 │                0 │          │
│ arrayElement              │            0 │                0 │          │
│ arrayEnumerateUniq        │            0 │                0 │          │
│ arrayEnumerateDenseRanked │            0 │                0 │          │
│ arrayEnumerateUniqRanked  │            0 │                0 │          │
│ arrayEnumerateDense       │            0 │                0 │          │
│ arrayReduceInRanges       │            0 │                0 │          │
│ arrayPopBack              │            0 │                0 │          │
│ arrayPushBack             │            0 │                0 │          │
│ arrayIntersect            │            0 │                0 │          │
│ arrayFlatten              │            0 │                0 │          │
│ array                     │            0 │                0 │          │
│ arraySort                 │            0 │                0 │          │
│ arrayAUC                  │            0 │                0 │          │
│ arrayReverse              │            0 │                0 │          │
│ arrayEnumerate            │            0 │                0 │          │
└───────────────────────────┴──────────────┴──────────────────┴──────────┘

44 rows in set. Elapsed: 0.006 sec. 


可以看到这个里面的函数是最全的,新增的一些函数在官方文档中则没有:
arrayStringConcat 
arrayEnumerateDenseRanked
arrayEnumerateUniqRanked  
arrayEnumerateDense

可以看到和array直接相关的函数就有44个。

和数组间接相关的函数:
Clickhouse> select * from system.functions where lower(name) like '%arr%';

则总计有69个之多

高阶函数(Higher-order function)

高阶函数的定义:



目前支持的高阶函数:

arrayMap(func, arr1, …)
arrayFilter(func, arr1, …)
arrayFill(func, arr1, …)
arrayReverseFill(func, arr1, …)
arraySplit(func, arr1, …)
arrayReverseSplit(func, arr1, …)
arrayCount([func,] arr1, …)
arrayExists([func,] arr1, …)
arrayAll([func,] arr1, …)
arraySum([func,] arr1, …)
arrayFirst(func, arr1, …)
arrayFirstIndex(func, arr1, …)
arrayCumSum([func,] arr1, …)
arrayCumSumNonNegative(arr)
arraySort([func,] arr1, …)
arrayReverseSort([func,] arr1, …)

高阶函数的限制:
lambda表达式不能在下列高阶函数中被引用:
arrayMap
arrayFilter
arrayFill
arrayReverseFill
arraySplit
arrayReverseSplit
arrayFirst
arrayFirstIndex

数组相关的函数: 

功能说明函数名相同功能的函数高阶函数
函数判断数组是否为空empty  
函数判断数组不为空notEmpty  
数组的长度length  
将空数组转换stringemptyArrayToSingle  
生成整型数组range(start, end [, step])  
数组创建array() 或者[]  
获取数据元素arrayElement(arr, n) 或者 arr[]  
是否包含某一个元素has(arr, elem)  
是否包含某几个元素hasAll(set, subset)  
判断两个数组的交集元素hasAny(array1, array2)  
判断两个数组顺序是否一样hasSubstr(array1, array2)  
数组中第一个元素首次出现的位置indexOf(arr, x)  
数组中某元素出现的次数countEqual(arr, x)  
生成自1开始的数组arrayEnumerate(arr)  
统计元素出现的次数arrayEnumerateUniq(arr, …) 高阶函数
删除数组中最后一个元素arrayPopBack  
删除数组中第一个元素arrayPopFront  
在数组中的末尾加入元素arrayPushBack(array, single_value)  
在数组中的前端加入元素arrayPushFront(array, single_value)  
修改数组的长度arrayResize(array, size[, extender])  
数组的拼接arrayConcat(arrays)  
数据的切片arraySlice(array, offset[, length])  
数据的排序(正向排序)arraySort([func,] arr, …) 高阶函数
数组的反向排序arrayReverseSort([func,] arr, …) 高阶函数
数据的元素去重arrayUniq(arr, …)  
数据的连接arrayJoin(arr)  
数组元素的差值
arrayDifference(array)
  
数组元素的去重arrayDistinct(array)  
数组元素出现的次数和位置arrayEnumerateDense(arr)  
数组元素的交集arrayIntersect(arr)  
数组元素的reduce
arrayReduce(agg_func, arr1, arr2, arrN)
  
数组元素的reducearrayReduceInRanges  
数组的反转arrayReverse(arr)  
数组的反转reverse(arr)  
数组的展平arrayFlatten  
数组的紧凑arrayCompact  
数组的ziparrayZip  
数组的AUC计算arrayAUC  
数组隐射arrayMap(func, arr1, …) 高阶函数
数组的过滤arrayFilter(func, arr1, …) 高阶函数
数组的填充arrayFill(func, arr1, …) 高阶函数
数组的反向填充arrayReverseFill(func, arr1, …) 高阶函数
数组的切割arraySplit(func, arr1, …) 高阶函数
数组的反向切割arrayReverseSplit(func, arr1, …) 高阶函数
数组的计算arrayCount([func,] arr1, …) 高阶函数
数组的求和arraySum([func,] arr1, …) 高阶函数
数组的存在arrayExists([func,] arr1, …) 高阶函数
数组的allarrayAll([func,] arr1, …) 高阶函数
数组的第一个arrayFirst(func, arr1, …) 高阶函数
数组的第一个索引arrayFirstIndex(func, arr1, …) 高阶函数
数组的累计求和arrayCumSum([func,] arr1, …) 高阶函数
数组的非非负数求和arrayCumSumNonNegative(arr) 高阶函数
数组的正向排序arraySort([func,] arr1, …) 高阶函数
数组的负向排序arrayReverseSort([func,] arr1, …) 高阶函数

示例:

 

参考:

https://clickhouse.tech/docs/en/sql-reference/functions/array-functions/

https://clickhouse.tech/docs/en/sql-reference/functions/higher-order-functions/

### ClickHouse 数组函数概述 ClickHouse 提供了一系列强大的数组操作函数,这些函数可以方便地对数组类型的字段进行各种变换和计算。常见的数组函数涵盖了创建、修改以及查询数组中的元素。 #### 创建数组 可以通过 `array` 函数直接定义一个数组: ```sql SELECT array(1, 2, 3); ``` 也可以通过其他方式生成动态数组,比如利用 `range` 或者 `arrayMap` 来构建基于某些条件的数组[^3]。 #### 修改数组 对于已有的数组,如果想要对其进行转换或筛选,则可采用如下几种典型的方法之一: - **过滤**: 使用 `arrayFilter` 可以根据给定谓词保留符合条件的项。 ```sql SELECT arrayFilter(x -> x % 2 = 0, [1, 2, 3, 4]); ``` - **映射**: 利用 `arrayMap` 对原数组里的每一个成员应用指定表达式并返回新的数组。 ```sql SELECT arrayMap(x -> x * 2, [1, 2, 3]); ``` - **连接两个数组**: 如果有多个同类型的数据集希望合并起来形成更大的集合,那么就可以考虑使用 `concat`. ```sql SELECT concat([1, 2], [3, 4]); ``` #### 查询数组 当涉及到从现有表结构里提取特定位置上的数值或是统计整个列表的信息时,下面几个实用工具就显得尤为重要了: - **获取长度**: 计算某个向量内含多少个组件可通过调用 `length`. ```sql SELECT length([1, 2, 3]); ``` - **访问单个元素**: 若要读取具体下标的项目则需借助于 `getElementByIdx`, 不过需要注意的是索引是从零开始计数的. ```sql SELECT getElementByIdx([10, 20, 30], 1); -- 返回20 ``` 另外,在实际应用场景当中经常会遇到需要将多条记录汇总成单一的结果形式的情况,这时像 `groupArray` 和之前提到过的 `groupUniqArray` 这样的聚合类功能就会非常有用处了[^2].
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值