hive字符串相关操作整理

6 篇文章 0 订阅
1 篇文章 0 订阅

内置操作

||可以实现字符串的拼接,和concat作用一样

内置函数

下面汇总一些比较常用的函数

返回类型签名描述
stringconcat(string|binary A, string|binary B…)将传入的字符串或者字节依次拼接,接受任意个数的参数
stringconcat_ws(string SEP, string A, string B…)使用指定分隔符SEP将字符串拼接
stringconcat_ws(string SEP, array< string>)使用指定的分隔符将array中的元素拼接
stringget_json_object(string json_string, string path)根据指定的json路径从json字符串中提取json对象,并返回提取的json对象的json字符串。如果输入的json字符串无效,它将返回null。注意:json路径只能有字符[0-9a-z],即没有大写或特殊字符。此外,键不能以数字开头,否则可以使用视图解决
intlength(string A)返回字符串长度
intlocate(string substr, string str[, int pos])返回在position pos之后str中第一次出现substr的位置如果失败则返回0,如果一个为null则返回null
intinstr(string str, string substr)返回在str中第一次出现substr的位置。如果其中一个参数为null,则返回null;如果在str中找不到substr,则返回0。请注意,这不是基于零的。str中的第一个字符具有索引1
stringlower(string A)将字符转化为小写的字符串
stringlpad(string str, int len, string pad)返回str,左填充pad,长度为len。如果str长于len,则返回值将缩短为len个字符(优先保留左边)。如果填充字符串为空,则返回值为空
stringltrim(string A)清除左侧的空格
stringparse_url(string urlString, string partToExtract [, string keyToExtract])从URL返回指定的部分。partToExtract的有效值包括HOST、PATH、QUERY、REF、PROTOCOL、AUTHORITY、FILE和USERINFO。例如,parse\u url(‘http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1’,‘主机’‘返回’脸谱网’. 此外,还可以通过将键作为第三个参数来提取查询中特定键的值,例如parse\ url(‘http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1’,‘QUERY’,‘k1’)返回’v1’
stringregexp_extract(string subject, string pattern, int index)返回使用模式提取的字符串,注意正则使用的是Java的,尤其注意转义的问题。0对应原始字符串,1+分别对应要提取的子串
stringregexp_replace(string INITIAL_STRING, string PATTERN, string REPLACEMENT)返回替换初始字符串中与模式中定义的java正则表达式语法相匹配的所有子字符串所产生的字符串
stringrepeat(string str, int n)将字符串重复n次
stringreplace(string A, string OLD, string NEW)使用指定子串替换输入中的子串
stringtranslate(string|char|varchar input, string|char|varchar from, string|char|varchar to)按照from和to的字符对饮关系对输入中的字符进行替换。注意,如果to长度小于from,没有对应关系的from中的字符会被替换为''。此外replace是子串的替换,这里是字符对应的替换
stringsubstr(stringbinary A, int start)或substr(string
arraysplit(string str, string pat)使用正则模式pat切分字符串
stringsubstring_index(string A, string delim, int count)返回分隔符delim(从配置单元1.3.0起)出现次数之前字符串A中的子字符串。如果count为正,则返回最后定界符左侧的所有内容(从左侧开始计数)。如果count为负数,则返回最后定界符右侧的所有内容(从右侧开始计数)。子字符串索引在搜索delim时执行区分大小写的匹配。如substring_index(‘www.apache.org’, ‘.’, 2) = ‘www.apache’,substring_index(‘www.apache.org’, ‘.’, -2) = ‘apache.org’

其他例如trim,upper,initcap等用法很直观不再赘述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值