一次Hudi Jar包中的HBase冲突导致的Spark任务失败
一、 问题描述
2022-08-08: 00:40 左右,正准备睡觉,Airflow调度任务出现了一些任务报错告警,于是爬起来打开电脑看是什么原因。
二、 问题分析及日志
2.1 问题分析
看了日志大概是Hbase版本的问题,当前的Hbase版本过高,导致Spark任务报错。于是检查了CDH集群,一切正常,Hbase也没有什么问题。经过半小时的各种分析,在CM->HBase->Commands->Recent Commands 最近的命令记录中发现了一条 Deploy Client Configuration 记录,原来是前一天下午在测试Hudi时,在Hive配置中指定了Hive Auxiliary JARs Directory的一个目录/opt/cloudera/parcels/CDH/lib/hive/auxlib,并且在改目录中添加了两个Jar包
hudi-hadoop-mr-bundle-0.11.0.jar
hudi-hive-sync-bundle-0.11.0.jar
这两个jar包中有引入HBase,移除后解决问题。
2.2 报错日志
22/08/08 00:42:38 ERROR spark.SparkTask: Failed to execute Spark task "Stage-8"
java.lang.RuntimeException: hbase-default.xml