hive正则表达式之读取access.log日志

Hive里的正则表达式

如,hive的官网底部
输入regex可查到

下面就是hive里的正则表达式,9个字段,对应定义那边也要9"input.regex" = "([^ ]*) ([^ ]*) ([^.]*) \[(.*)\] "(.*)" (-|[0-9]*) (-|[(0-9]*) "(.*)" "(.*)""

([^ ]*) ([^ ]*) ([^.]*) \[(.*)\] "(.*)" (-|[0-9]*) (-|[(0-9]*) "(.*)" "(.*)"
([^ ]*) ([^ ]*) ([^.]*) \\[(.*)\\] "(.*)" (-|[0-9]*) (-|[(0-9]*) \"(.*)\" \"(.*)\"

最后一行是加了转义字符

数据来源 是 /var/log/nginx/ 下面有access.log 日志 符合上面的正则
CREATE TABLE accesslog (
host STRING,
identity STRING,
users STRING,
time STRING,
request STRING,
status STRING,
size STRING,
referer STRING,
agent STRING)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = "([^ ]*) ([^ ]*) ([^.]*) \\[(.*)\\] \"(.*)\" (-|[0-9]*) (-|[(0-9]*) \"(.*)\" \"(.*)\""
)
STORED AS TEXTFILE;



load data local inpath '/home/hivedata/access' into table accesslog;

小问题:

1.字段user好像是关键字 不让用 所以使用users
ParseException line 4:0 Failed to recognize predicate

0: jdbc:hive2://hadoop01:10000> STORED AS TEXTFILE;
Error: Error while compiling statement: FAILED: ParseException line 4:0 Failed to recognize predicate 'user'. Failed rule: 'identifier' in column specification (state=42000,code=40000)

2.没有添加转义字符 \ 的问题
java.util.regex.PatternSyntaxException: Unclosed character class near index 98

Error: Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. java.util.regex.PatternSyntaxException: Unclosed character class near index 98
([^ ]*) ([^ ]*) ([^.]*) \[(.*)\] "(.*)" (-|[0-9]*) (-|[(0-9]*) "(.*)" "(.*)"
                                                                                                  ^ (state=08S01,code=1)

结果是可以的
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值