Hive SQL判断一个字符串中是否包含字串的N种方式及其效率

Hive SQL判断一个字符串中是否包含字串的N种方式及其效率

背景

这是个常见需求,某个表tab中,需要判断某个string类型的字段中,哪些数据含有一个子串。以下给出6种方案,并给出效率对比。

方案1:regexp_extract

可以使用regexp_extract(subject, pattern, index)函数来提取字符串中匹配指定正则表达式的字串。要判断一个字符串中是否包含字串"ABCD;",可以使用如下代码:

SELECT
  CASE
    WHEN regexp_extract(subject, 'ABCD;', 0) != '' THEN '包含'
    ELSE '不包含'
  END AS is_contain
FROM
  your_table;

其中,subject是要判断的字符串,'ABCD;‘是要匹配的字串,0表示从整个匹配结果中获取整个字串。如果返回的字串不为空,则说明匹配到了,即包含字串’ABCD;’,否则不包含。你需要将your_table替换为你实际使用的表名或子查询。

方案2:instr

使用instr(str, substr)函数来实现,使用类似下面的代码:

SELECT
  • 22
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值