0666-6.2.0-如何在CDH6.2.0上安装CDSW1.5

Fayson的github: https://github.com/fayson/cdhproject

推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f

1 文档编写目的

Cloudera在2019年1月29日发布CDSW1.5,CDSW1.5的一个最大的更新就是支持CDH6和HDP,在1.5之前,CDSW是不能安装到CDH6.x的。CDH5.13版本以后支持CDSW的Parcel安装,本篇文章Fayson就主要讲述如何通过CM6.2使用Parcel包安装CDSW1.5。

CDSW需要DNS服务和泛域名解析,可以参考Fayson以前的文章《如何在Windows Server2008搭建DNS服务并配置泛域名解析》、《如何利用Dnsmasq构建小型集群的本地DNS服务器》、《如何在Windows Server2012搭建DNS服务并配置泛域名解析》,《如何在RedHat6上使用Bind搭建DNS服务》或《如何在RedHat7上使用Bind搭建DNS服务》,CDSW1.5的新功能可以参考《0544-CDSW1.5的新功能》。搭建DNS服务推荐Dnsmasq,小巧可爱特方便。

内容概述

1.部署CDSW parcel及安装CSD文件
2.添加CDSW节点到集群并部署Gateway角色
3.安装DNS服务并配置泛域名解析
4.安装CDSW服务
5.测试CDSW

测试环境

1.Redhat7.2
2.采用root用户操作
3.CM/CDH6.2.0
4.CDSW版本1.5

前置条件

1.CM和CDH已安装且正常运行
2.集群已部署Spark2 On Yarn模式
3.集群已部署Anaconda
4.集群已配置好DNS服务并配置CDSW节点的泛域名解析
5.CDSW节点已经通过CM加入到集群中

2 安装CDSW

2.1 CDSW节点配置

在准备新添加的CDSW节点上按照之前安装CDH集群的要求,配置好需要的设置。

包括下面这些

修改hostname,并更新到所有节点的/etc/hosts文件

[root@cdsw ~]# hostnamectl set-hostname cdsw.macro.com

在这里插入图片描述
关闭防火墙,禁用SELinux

[root@cdsw yum.repos.d]# systemctl stop firewalld
[root@cdsw yum.repos.d]# systemctl disable firewalld
[root@cdsw yum.repos.d]# setenforce 0

在这里插入图片描述
关闭透明大页面,设置SWAP为1

[root@cdsw ~]# echo 1 > /proc/sys/vm/swappiness
[root@cdsw ~]# echo never > /sys/kernel/mm/transparent_hugepage/defrag 
[root@cdsw ~]# echo never > /sys/kernel/mm/transparent_hugepage/enabled

配置时钟同步

配置好OS的yum源后,卸载原有的chrony然后安装ntp服务

[root@cdsw yum.repos.d]# yum install -y ntp

安装好后,修改/etc/ntp.conf 让cdsw节点跟cdh01节点同步

然后重启ntpd服务,验证是否和主机已经同步,用下面的命令

[root@cdsw ~]# ntpq -p

前面出现*号 表明同步成功
在这里插入图片描述

在这里插入图片描述

2.2 部署Parcel包,安装CSD文件

把Parcel下载下来,地址如下,放到/var/www/html/cdsw1.5 这个目录下,部署成功

https://archive.cloudera.com/cdsw1/1.5.0/parcels/CDSW-1.5.0.p1.849870-el7.parcel
https://archive.cloudera.com/cdsw1/1.5.0/parcels/CDSW-1.5.0.p1.849870-el7.parcel.sha
https://archive.cloudera.com/cdsw1/1.5.0/parcels/manifest.json

在这里插入图片描述
下载CSD文件,使CM支持CDSW安装,文件下载地址

https://archive.cloudera.com/cdsw1/1.5.0/csd/CLOUDERA_DATA_SCIENCE_WORKBENCH-CDH6-1.5.0.jar

下载好后放在CM所在服务器的/opt/cloudera/csd目录下

[root@cdh01 ~]# cp CLOUDERA_DATA_SCIENCE_WORKBENCH-CDH6-1.5.0.jar /opt/cloudera/csd/

在这里插入图片描述
重启cloudera-scm-server服务

[root@cdh01 csd]# systemctl restart cloudera-scm-server

2.3 添加CDSW节点到集群

1.登录CM,新建一个主机模板,选择模板角色

在这里插入图片描述

在这里插入图片描述
添加节点到集群
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
一直点下一步,到添加主机模板这里,选择刚才创建的模板

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
完成后,可以看到cdsw节点已经添加进集群并且角色已经添加成功。

2.4 配置CDSW的Parcel库

在CM主页点开Parcel页面,添加CDSW的Parcel地址

在这里插入图片描述
然后下载,分配,激活

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2.5 安装DNS服务并配置泛域名解析

1.安装dnsmasq

[root@cdsw ~]# yum -y install dnsmasq

2.验证安装

[root@cdsw ~]# dnsmasq -v

在这里插入图片描述
3.配置DNS服务以及泛域名解析,在/etc/dnsmasq.conf文件末尾增加以下配置。

[root@cdsw ~]# vim /etc/dnsmasq.conf
strict-order
listen-address=192.168.0.195
addn-hosts=/etc/hosts
address=/cdsw.macro.com/192.168.0.195
address=/cdsw/192.168.0.195

在这里插入图片描述
4.启动dnsmasq服务,并加入开机自启动

[root@cdsw ~]# systemctl start dnsmasq
[root@cdsw ~]# systemctl enable dnsmasq

5.修改/etc/resolv.conf文件配置,在nameserver中增加创建的DNS服务器IP地址,这里是将cdsw本机配置为dns服务器,所以将cdsw这台机器的内网IP地址配置到该文件中。

[root@cdsw ~]# vim /etc/resolv.conf

在这里插入图片描述
6.泛域名解析测试

[root@cdsw ~]# nslookup 192.168.0.195
[root@cdsw ~]# nslookup cdsw.macro.com
[root@cdsw ~]# nslookup xxx.cdsw.macro.com

在这里插入图片描述

2.6 安装CDSW服务

在CM主页,集群按钮旁,点击添加服务

在这里插入图片描述

选择CDSW
在这里插入图片描述

在这里插入图片描述
继续,选择Master主机,由于只有一台服务器,就不添加work节点了。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
安装完成
在这里插入图片描述

3 验证CDSW功能

在登陆CDSW之前,我们先配置好Windows机器里面的DNS服务和hosts文件
在这里插入图片描述

在这里插入图片描述

配置完之后,登陆CDSW

在这里插入图片描述

点击Web UI,进入登陆界面,点击注册
在这里插入图片描述

注册完成后,自动登陆CDSW界面,首次注册的账号自动为管理员账号
在这里插入图片描述

点击New Project创建一个Python工程
在这里插入图片描述
点击Create Project,然后点击Open Workbench
在这里插入图片描述
点击Launch Session
在这里插入图片描述

执行示例代码,验证完成
在这里插入图片描述

5 总结

  • CDSW访问时需要用到泛域名,因此必须为CDSW Master节点配置泛域名解析,具体可参看Fayson前面讲的《如何在Windows Server2008搭建DNS服务并配置泛域名解析》、《如何利用Dnsmasq构建小型集群的本地DNS服务器》、《如何在Windows Server2012搭建DNS服务并配置泛域名解析》,《如何在RedHat6上使用Bind搭建DNS服务》或《如何在RedHat7上使用Bind搭建DNS服务》

  • CDSW节点是运行在CM管理的Gateway节点上的,所有CDSW的节点需要满足CDH的前置条件检查,具体可以参考《CDH安装前置准备》

  • CDSW所有节点需要加入CDH集群,并部署HDFS 、Yarn、Spark2的Gateway

  • CDSW Master节点需要有多块DISK,磁盘空间大于100G,不需要对磁盘进行格式化分区操作。

  • 注意CDH6的CDSW的csd文件与CDH5的是不相同的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值