前两天在CDH上用命令行访问impala,因集群添加了kerberos认证,访问需要先认证。在目录里找了一圈没有找到能成功认证的keytab,然后就自己去网上搜索如何生成keytab,结果keytab没有生成成功,那个节点上impala的principal密码还被改了。正好这个节点上运行了impala的catalog server,于是整个impala集群就启动不了。目前集群又没有运维的支持,只能自己去搞
前期查到是认证问题后,就各种百度,bing搜索,看一圈下来,基本没有能当下处理情况的信息。后来去查了官网,官网上给的建议更绝望:
这是别人写在警告里的我都做了的节奏,这下感觉自己像犯了大错,估计只能将kerberos认证全集群取消了重来才能解决问题
为了不这么绝望,自己去官网的论坛发了个问题求助,但看的人不少,没有人提建议,估计都在想这得多傻X才会这样干
impala出问题后监控界面和手动认证报如下错误:
cdh界面日志中的错误:
手动认证的错误 :
看了很多文档,对kerberos和cdh的kerberos的认证有一些了解后,自己做了不少尝试,最后总算通过了,操作本身超级简单,大概操作如下:
- 将错误节点上的所有impala.keytab文件移动到cdh不能访问的目录
- 在cdh界面重新生成认证错误节点上impala的principal
- 重启impala