CDH
文章平均质量分 79
枫夜求索阁
毕业于华南农业大学,现就业于凯通科技股份有限公司,为高级软件工程师。主要工作是和大数据相关,熟悉spark、CDH等大数据相关领域技术。
展开
-
问题解决:java运行HiveQL,报错:java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration
使用Java编写HiveQL语句,然后通过jdbc的方式远程连接hive集群,并执行。在执行过程中,出现报错,其错误信息为:“java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration”。根据这个问题提示,按照步骤解决了问题,并整理成博文输出。原创 2020-06-17 23:38:39 · 16973 阅读 · 5 评论 -
问题解决:Given NMToken for application : appattempt_xxx is not valid for current node manager
执行HiveQL脚本的时候,提示“Given NMToken for application : appattempt_xxx is not valid for current node manager”,根据问题提示,找到问题发生的原因,并加以解决!原创 2020-06-10 00:22:06 · 667 阅读 · 0 评论 -
问题解决:CDH重启报错,启动不了的解决步骤
因为园区突发断电,导致服务器断电。部署在服务器上面的CDH集群都挂了。现在需要重新启动起来,但是重启之后,服务一直启动不起来。本篇博文主要是针对这种情况,阐述解决问题的思路和问题解决的过程。原创 2020-05-22 14:30:36 · 6118 阅读 · 0 评论 -
客户环境没办法查看Spark UI页面,怎么办?让我们来使用Spark REST API查看作业信息吧!
场景通过跳转机才能访问到spark集群的机器;想定制属于自己公司的spark监控界面环境CDH 5.13Spark 1.6IP关系IP类型作用运行过程中,提示出现的链接,如:http://localhost:4040监控运行过程中的应用spark.yarn.historyServer.address监控已经结束的应用情况使用步骤获取spa...原创 2020-03-15 17:19:09 · 1256 阅读 · 0 评论 -
问题解决:Only SubQuery expressions that are top level conjuncts are allowed
文章目录问题场景问题环境问题原因解决方案结果总结PS问题场景在CDH的hue界面控制台上面,使用hive组件,执行较为复杂的SQL,SQL内含有in关键字,而in内部是关联其他表的结果。因为里面含有or字段,导致hive解析SQL的时候,认为in的条件不是位于第一序列,然后报错。可能说着很抽象,以下是SQL:select a.a1,a.a2,count(*) as numfrom test...原创 2020-03-09 13:04:23 · 16273 阅读 · 0 评论 -
问题解决:Not able to initialize app directories in any of the configured local directories
问题场景集群之前启用了Kerberos,但是后来为了使用方便,将相关的配置都去除了。在hive上面执行SQL,比如select a from b where a.t ='1';这句简单的SQL都会报错,报错提示如下:Application application_1581349098902_0008 failed 2 times due to AM Container for appattem...原创 2020-03-06 18:31:15 · 1384 阅读 · 0 评论 -
问题解决:CDH集群-无法找到主机的NTP 服务,或该服务未响应时钟偏差请求
场景CDH集群启动成功,但是有某些主机提示“无法找到主机的NTP 服务,或该服务未响应时钟偏差请求”问题思路NTP服务没有正常启动CDH后台程序存在异常解决脚本先关闭CDH的服务,在界面进行关闭集群服务每台主机开启NTP服务systemctl restart ntpd 每台主机重启cloudera-scm-agent systemctl restart clo...原创 2020-02-10 23:56:50 · 4843 阅读 · 4 评论 -
CDH-Kerberos环境下,HBASE java连接
下载相关配置文件登录CDH控制台,到HBASE的登录页面,下载相关的配置文件到本地新建maven项目,将相关的配置文件存放到src/resources目录下面登录kerberos主机,生成hbase的kerberos密钥文件。然后和krb5.conf一起下载到本地,也是同样存放到src/resources目录下面本地hosts文件填写相关的CDH集群信息pom....原创 2019-11-11 10:15:49 · 1603 阅读 · 6 评论 -
CDH磁盘空间即将满之后的解决措施
版本环境CDH 5.15.58台主机,每台机存储100GB,内存为8GB问题CDH页面报错,一些服务挂掉,无法使用。查看主机存储,发现有3-4台机器的存储即将满了。而namenode的存储空间即将满。解决措施登录namenode的后台,删除不必要的文件。因为是使用ansible进行批量的部署,所以本机依旧存储之前的安装包,总大小大概为8GB左右。删除该安装包,腾出8GB。CM管理控...原创 2019-08-28 15:12:13 · 4170 阅读 · 1 评论