cdh hive on spark_0721-5.10.0-CM接管rpm方式安装的无CM的CDH集群

在Cloudera Manager上添加CDH服务

逐个添加所有服务,需要注意的是服务之间有依赖关系,推荐按照下列顺序进行服务的添加:

1)Zookeeper

2)HDFS

3)Yarn

4)Spark

5)Hive

6)Impala

7)Oozie

8)Hue

一般来说添加服务的步骤几乎是相同的:

1)在Cloudera Manager上添加服务

2)角色的分配与之前保持一致

3)应用所有配置文件

4)启动服务

6.1添加Zookeeper

1.从CM添加Zookeeper服务

2d1665cdf7fb5234d5a9a4abfb8b2390.png

2.选择Zookeeper服务

d1a49d6b944d713133f4b81621638de1.png

3.选择ZK Server,与之前安装时一致

a6e10d43690dee058f654970d8e67052.png

4.设置与之前相同的目录

8ce19e95ae0bb27caae4b660143edd4e.png

5.不点击继续,直接点击左上角回到CM主页,进入Zookeeper的配置

569d4b17f2d94fb8e16ca6b7e66ecb66.png

6.应用之前的配置,保持与之前一致

Server ID保持与之前安装时设置的一致

23e7275742065fb421171e2a6c48e1b5.png

修改/var/lib/zookeeper/version-2的属主为zookeeper

abaf89226b3103167275334aea797380.png

设置堆栈大小

16c06124a4d0ccc63c949f528c1e8d72.png

保证设置的ZK log目录和Heap Dump目录空间足够,如果默认的目录空间不够,则进行修改

a37882f519b022b721103729dbd59162.png
7750321e3c6bfd7a766ec150d35059f6.png

7.启动Zookeeper

7a273e6f4c8ef1d2f0475a69064a9309.png
22fc72a8488a2935b867d1dc321d330f.png

6.2 添加HDFS

1.从CM上添加HDFS

fde41124a09bc01961d05936597db76d.png

2.选择角色,保持与之前的安装一致

f0e21e9be9fd247a078e3220f88ae970.png

3.保持目录与之前一致

f573cc793176463ea5ef097409b2b50b.png

4.删除/data0/dfs/nn目录下NN的元数据,启动HDFS

8052112fa094969a371f04c842c686db.png

5.将之前备份的NameNode元数据拷贝回/data0/dfs/nn目录

8a4f66d8198d7887c2960dc7541ea0f7.png

6.验证HDFS的数据与之前是否一致

列出HDFS的目录,与之前一致,能够看到最开始上传用作测试的两个tar包

93627ec727d7629eac2deabb6a9cd7f0.png

使用fsck命令查看,数据与之前一致

4b201eef7bdd78e422d73429160a150b.png

6.3添加Yarn

1.在CM上添加Yarn服务

2f405cf170d9f66877538c4234f1b44e.png

2.选择角色,保持与安装的一致

6966222535086d8a2cd84e76f12ff040.png

3.设置Yarn的目录与之前安装的一致

602192997c758910f13fe08b42ad7fda.png

4.启动Yarn

06f9f47c763e38ffc25b93862928af79.png

5.Yarn启动成功

ff28246a81ecc3f24801ed607196b3c3.png

6.运行MR示例程序进行测试,示例程序运行成功

caa124ba3f3575a0cabfd79dd352bdc9.png
3329163a8788785ce3c60c58be73334b.png

6.4添加Spark

1.从CM上添加Spark,选择Spark而不是Spark(Standalone)

b3f0dafbc984b36755be30ab4c658dda.png

2.保持角色与之前一致,Gateway选择所有节点

11397541c8483649c04c685f1cd04004.png

3.启动Spark

be5beaef49053f1513e165dbc67275cf.png

4. Spark安装成功

d9a5ff7b839be0d9b5b0227e872167eb.png

重启相关的服务

e44d973b9cd57d860f648c966e1253b9.png

重新部署客户端配置

91a09fee85415f1911d119644bc2e8e4.png

重启成功

4a2b3536b9d3e42b7320b5c80868d61a.png

6.5添加Hive

1.在CM上添加Hive服务

94b68462bd0d0905446bfe7f0b8fc3c1.png

2.为Hive选择依赖关系

68382336884c6030558b5d5417a6814f.png

3.选择角色,与之前的安装保持一致

738a0affba9e5dcc1203c81fa4ec582b.png

4.设置数据库

65aca48c2871b8455ea8683468eb155b.png

5.Hive的目录,确保与之前安装配置的一致

5308fd0e1029363800b7f3b03706599a.png

6.启动Hive

da67d923df3bca3d553ec019f057ce9b.png

7.Hive安装成功

b259edcb8b3080c505b2e62515005b14.png

8.验证Hive的数据与之前是否一致

查看库,可以看到之前创建的两个库test1、test2

5398047bd578e60b032acb13c5b4a416.png

查看库test1,可以看到之前创建的表web_returns

f96697087be28f854c7e2b4551092e92.png

查看表web_returns的数据,与之前一致

55a70bccf3899b811bb0849e8b7eb138.png
8c7405eff99993d88558c6d2a008e3c1.png

查看库test2,可以看到之前创建的表test_partition

00c9471075e2d812a4651066ea59dbdd.png

查看表test_partition的数据,与之前一致

606c7120e31a407da38de43167aaa75a.png
f2378ac4729dad493fd33332c39d815e.png

6.6添加Impala

1.在CM上添加Impala

6fa65baa9a77186d3875c135e6b20de0.png

2.为Impala选择角色,与之前的安装保持一致

1051d3d02ab1a32c256b06bc68c0198c.png

3.为Impala指定目录

0612ea8093dbccf760efec408b5ceb3e.png

4.创建Impala用户目录

751c47333f9e609ed6486b91ea880f1f.png

5.Impala安装成功

6ba2af3255b3ca1417faaaf8aec4278e.png

6.启动Impala

d805bda6c0f466388460a173f034841d.png

7.测试Impala使用

79e573cf8a75228a2ce26a3a12f8e639.png

6.7添加Oozie

1.在CM上添加Oozie服务

7124ee9af500aeb2cb7b77b6a35290d4.png

2.为Oozie服务选择依赖关系

3d7757101710870f0a33607180be5ac2.png

3.选择角色,保持与之前一致

1c819c0aa2fd17014328d7cdec255e0a.png

4.设置数据库

e71faab8183c02bdc54646fc6aec0b08.png

5.指定Oozie共享库目录和数据目录,与之前的安装保持一致

c63e7868b97c452a8832fcb90a6e2268.png

6.启动Oozie服务

4e4655536d0f7afafb0366838523c088.png

7.Oozie服务安装成功

eb7deaaa82a61bd2b700892c7c496e01.png

6.8添加Hue

1.在CM上添加Hue

8fd12fc45ab1d43eb2ee6bbd6e9956f4.png

2.为Hue选择依赖关系

83cce705ed6bd6901425a3d419af97cc.png

3.选择角色,与之前安装时一致

79b0aa753dfac3413d5ffe0ccddf1dfd.png

4.设置数据库

b82280678074db4d2d79317fd1f9aafa.png

5.启动Hue

3845bb0f73b93383b5e4ffb6f80a8cf2.png

6.Hue服务添加成功

1b6472b10ed9454331c21518dc4dc14b.png

7.访问Hue

37772efd2ef9f5b8225f0de6c1fb2ff5.png
e879b25d23da3aa5037ed116c7bc2c3c.png

8.测试Hue的使用

使用Hive

8381cf7d88a68c6c281650b60f3fd132.png

使用Impala

407655be670836b2cb1e9410a4d4d937.png

至此CM接管完成,CM主页如下图所示:

69cc63d779e4c27af3baf0a37f1645c2.png

总结

1.使用CM接管未受管的CDH集群,在添加服务时需要注意的是,要保持角色与之前安装时的角色一致,数据目录也需要指定成之前安装时的数据目录,以及一些配置也需要在CM上修改,与支持一致,保证CM接管后服务都与之前一样正常运行。

2.在接管之前需要对服务的一些数据和配置文件进行备份,在后面CM安装服务时需要用到。

3.在接管之前需要对服务进行检查,对数据进行记录,在接管后对数据进行对比,比如HDFS以及Hive,本文档在接管后,HDFS以及Hive中数据都与之前一致。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值