hive中concat_ws的秘密
1. 背景
在hive中,concat_ws有两种用法:
concat_ws("|", array('a', 'b'));
-- 输出a|b
concat_ws('|', 'a', 'b');
-- 输出a|b
其中,第一个参数是其它字符串的分隔符,concat_ws有个比较好用的特点,就是会自动跳过值为null的字符串(注意:空字符串不会跳过)。例如:
concat_ws('|', 'a', null, 'b');
-- 输出a|b
但是在工作中,我遇到了一个奇怪的问题:
concat_ws('|', 'a', null, 'b');
-- 输出a|b
concat_ws('|', array('a', null, 'b'));
-- 输出a|null|b
这就奇怪了,不是说concat_ws会忽略所有null吗,为什么这里非但没忽略,还输出了“null”字符串?
2. 源码探究
2.1 concat_ws源码
实在按奈不住好奇心,于是去扒了一下concat_ws的UDF源码:
@Override
public Object evaluate(