在 Spark SQL 中,array 是一种常用的数据类型,用于存储一组有序的元素。Spark 提供了一系列强大的内置函数来操作 array 类型数据,包括创建、访问、修改、排序、过滤、聚合等操作。以下是 Spark SQL 中所有与 array 类型相关的操作函数列表及其功能描述:
1. 创建数组
函数名 |
描述 |
array(v1, v2, ...) |
创建一个数组,包含指定的元素。 |
array_repeat(value, n) |
创建一个包含重复元素的数组,value 是元素,n 是重复次数。 |
sequence(start, stop[, step]) |
生成一个包含从 start 到 stop(步长为 step,默认为 1)的数组。 |
2. 数组元素访问
函数名 |
描述 |
element_at(array, index) |
返回数组中指定索引位置的元素,索引从 1 开始(支持负数,表示从尾部开始)。 |
get(array, index) |
返回数组中指定索引位置的元素,索引从 0 开始(如果索引越界返回 NULL)。 |
array[index] |
使用方括号访问数 |