hive
captJacklee
写代码比打游戏还爽!
展开
-
Hive 正则匹配函数 regexp_extract
1。regexp_extract语法: regexp_extract(string subject, string pattern, int index)返回值: string说明: 将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。第一参数: 要处理的字段第二参数: 需要匹配的正则表达式第三个参数:0是显示与之匹配的整个字符串1 是显示...原创 2018-02-23 16:03:36 · 1459 阅读 · 0 评论 -
hive中巧用正则表达式的贪婪匹配
贪婪匹配和非贪婪匹配的区别 .* 和 .*?举例如下: 从字符串"888|666|544"中提取最后一个竖线|后面的内容,但是在这个字符串中,竖线的个数不是固定的 。 使用hive中的regexp_extract函数实现如下:hive> select regexp_extract('888|666|544','.*\\|(.*)',1);OK544由于使用了正则表达式的贪婪匹配 .*,...原创 2018-02-23 16:19:19 · 4417 阅读 · 0 评论