DolphinScheduler启用Kerberos(亲测)

Zakza

已于 2023-03-10 10:29:36 修改

阅读量1.6k

点赞数 1

分类专栏： BigData 文章标签： Kerberos 小海豚调度 CDH6.3.2

于 2023-03-07 11:30:36 首次发布

本文链接：https://blog.csdn.net/qq_18453581/article/details/129377982

版权

BigData 专栏收录该内容

42 篇文章

订阅专栏

环境背景

使用DolphinScheduler3.0.0+CDH6.3.2(适配之前已存在任务环境)

已知问题

DolphinScheduler3.1.4默认是zookeeper3.8,需要手动编译zk3.4+,使用3.0.0正常

DolphinScheduler的hive相关依赖和CDH的版本不一致,需要在编译时修改pom文件

开启Kerberos时使用DolphinScheduler添加Hive数据源日志报错Peer indicated failure: Unsupported mechanism type PLAIN,在github的issue上有人说是bug,所以我手动编译3.1.4版本,问题依然存在,最终确定是依赖问题,下面附解决方法

hive数据源配置kerberos连接失败

执行spark yarn cluster任务失败 code -1000

添加hive数据源jdbc连接参数{"principal":"hive/_HOST@EXAMPLE.COM"},3.x版本的principle参数填写无效,保存->编辑无法回显,但是可正常使用

开始配置

按照官网说明修改master,worker,api模块下面的conf/common.properties相关的Kerberos配置

使用kadmin.local生成keytab文件及相应的princal,不让之前配置密码失效加-norandkey

kadmin.local -q "xst -k /opt/hdfs.keytab hdfs@EXAMPLE.COM"

crontab添加定时任务kinit -kt /opt/software/kerberos/hdfs.keytab hdfs

配置正确重启小海豚,spark任务不需要任何修改是可以正常执行的,添加hive数据源异常

思路参考

方法一(简单)

(1)复制依赖hive-shim相关依赖

cdh_jars=/opt/xxx/CDH-xxx/jars
dol314=/opt/dolphinscheduler
cp $cdh_jars/hive-shims-* $dol314/mater-server/libs
cp $cdh_jars/hive-shims-* $dol314/worker-server/libs
cp $cdh_jars/hive-shims-* $dol314/api-server/libs

(2)连接参数配置{"principal":"hive/_HOST@EXAMPLE.COM"}