Hive函数大全（含例子）之字符串函数（String Functions）

最新推荐文章于 2023-09-08 15:32:06 发布

种豆大叔

最新推荐文章于 2023-09-08 15:32:06 发布

阅读量2k

点赞数 2

分类专栏： hive 文章标签： hive 数据库 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35921007/article/details/105426407

版权

这篇博客详细介绍了Hive中的字符串函数，包括ascii、base64、concat、context_ngrams、decode、encode等，提供了丰富的示例，帮助理解其功能和用法。同时还提到了相关文章，如集合函数、日期函数和数学函数的介绍。

摘要由CSDN通过智能技术生成

字符串函数 String Functions

ascii(string str)

返回结果: 返回字符串str首字母的十进制ascii码
返回类型: int
select ascii('ABC'); -- 结果为 65

base64(binary bin)

返回结果: 将二进制转换为base64编码
返回类型: string
select base64(encode('Uncle Bean', 'utf8')); -- 结果为 VW5jbGUgQmVhbg==
select base64(encode('Melon-and-fruit-fields', 'utf-8')); -- 结果为 TWVsb24tYW5kLWZydWl0LWZpZWxkcw====

character_length(string str)

character_length 可缩写为 char_length
返回结果: 返回str中包含的UTF-8字符数
返回类型: int
select character_length('123456'); -- 结果为 6
select char_length('ABCDEFGHIJK'); -- 结果为 11

chr(bigint|double A)

返回结果: 将数字A转为对应的ascii字符, 如果A大于等于256，则结果同chr(A % 256)
返回类型: string
select chr(65); -- 结果为 A
select chr(65.6); -- 结果为 A
select chr(321); -- 结果为 A
select chr(321 % 256); -- 结果为 A

concat(string|binary A, string|binary B...)

返回结果: 拼接字符串，函数接受任意数量的输入
返回类型: string
select concat('A', 'C', 'B'); -- 结果为 ACB
select concat(encode('A', 'utf8'), encode('C', 'utf8'), encode('B', 'utf8')); -- 结果为 ACB

context_ngrams(array<array>, array, int K, int pf)

返回结果: 使用n-gram模型，通过指定array，提取前K个上下文文本；pf越大，精度越高，同时消耗的内存资源也更大
返回类型: array<struct<string,double>>
select context_ngrams(array(array('from','a'),array('from','a'),array('from','b')), array('from', null), 1); -- 结果为 [{"ngram":["a"],"estfrequency":2.0}]
select context_ngrams(array(array('from','a'),array('from','a'),array('from','b')), array('from', null), 2); -- 结果为 [{"ngram":["a"],"estfrequency":2.0},{"ngram":["b"],"estfrequency":1.0}]

concat_ws(string SEP, string A, string B...)

返回结果: 使用指定分隔符 SEP 拼接字符串，传入参数为多个字符串
返回类型: string
select concat_ws('-', 'Melon', 'and', 'fruit', 'fields'); -- 结果为 Melon-and-fruit-fields

concat_ws(string SEP, array)

返回结果: 使用指定分隔符 SEP 拼接字符串，传入参数为 array
返回类型: string
select concat_ws('-', array('Melon', 'and', 'fruit', 'fields')); -- 结果为 Melon-and-fruit-fields

decode(binary bin, string charset)

返回结果: 解码（字符集 charset 包括'US-ASCII', 'ISO-8859-1', 'UTF-8'

最低0.47元/天解锁文章

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。