HIVE正则匹配(深度应用)

工作中遇到一个案例,如下:

valueunitwant
4.0-10.0*10^9/L*10^9/L4.0-10.0
3.5-5.0*10^12/L*10^12/L3.5-5.0

两个字段,一个带单位的数值,一个单位
希望截取数值,例如want字段
首先想到regexp_replace函数regexp_replace(value ,unit,’’)
报错java.io.IOException: org.apache.hadoop.hive.ql.metadata.HiveException: Unable to execute method public org.apache.hadoop.io.Text org.apache.hadoop.hive.ql.udf.UDFRegExpReplace.evaluate(org.apache.hadoop.io.Text,org.apache.hadoop.io.Text,org.apache.hadoop.io.Text) on object org.apache.hadoop.hive.ql.udf.UDFRegExpReplace@3201f0e9 of class org.apache.hadoop.hive.ql.udf.UDFRegExpReplace with arguments {280.0-310.0:org.apache.hadoop.io.Text, mOsm/\(kg:org.apache.hadoop.io.Text, :org.apache.hadoop.io.Text} of size 3
明明输入是size 3不知道为什么会报错。查了很多资料没有搞定,还以为是regexp_replace函数不支持字段作为匹配规则。
后来发现是特殊字符的原因,需要转义才能识别为正则函数
1.unit字段有特殊字符的需要添加转义字符‘\’如下:
regexp_replace(
regexp_replace(unit, ‘\’ , '\\\’)
, ‘\^’ , ‘\\\^’) unit_pp
2.再进行替换不会报错了,后来验证无误。
regexp_replace(reference, unit_pp, ‘’)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值