hive：函数：size(数组字段)获取array长度和 length(字段)获取字符串长度

最新推荐文章于 2025-02-18 15:43:19 发布

花和尚也有春天

最新推荐文章于 2025-02-18 15:43:19 发布

阅读量3.5w

点赞数 2

分类专栏： hive 文章标签： hive length() size() 函数

本文链接：https://blog.csdn.net/weixin_38750084/article/details/97776251

版权

hive 专栏收录该内容

114 篇文章

订阅专栏

本文介绍如何使用SQL进行字符串长度获取、字符串转数组及数组长度计算等操作，通过具体实例展示了如何利用collect_list和size函数处理数据，适用于数据分析和数据工程师进行数据处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

获取字符串长度：length(字段)

字符串转数组：collect_list 列转行可得到数据，或split()某个字段得到数组

获取数组长度：size(数组字段)

参考sql：

set edate=2019-07-21
SET company=***;
SET recomrecords=ods.ods_${hiveconf:company_RecomRecords;
SET employees=ods.ods_${hiveconf:company}_base_employees;
SET branchs=ods.ods_${hiveconf:company}_base_branchs;
SET regions=ods.ods_${hiveconf:company}_base_regions;

SELECT
    EmployeeNo,
    collect_list(FillinDate)                                   FillinDate,
    collect_list(FillinDate)[size(collect_list(FillinDate))-1] FillinDate,//取数组最后一个值
    size(collect_list(FillinDate))
FROM
    ${hiveconf:recomrecords}
WHERE
    EmployeeNo='401800106'
AND FillinDate>='2019-07-15'
AND FillinDate<='2019-07-21'
AND PhaseId=10
AND IsApprove=1
AND IsCancel IS NULL
GROUP BY
    EmployeeNo
ORDER BY
    fillindate DESC