CenterOS7.2下搭建CDH5.15

目录

  • 1.安装总概
    • 1.1. 软件环境
    • 1.2. 配置规划
    • 1.3. CheckList
  • 2.软件资源
    • 2.1. JDK环境:
    • 2.2. scala环境:
    • 2.3. CM包:
    • 2.4. CDH包
    • 2.5 manifest.json
    • 2.6. JDBC连接jar包:
  • 3.环境配置
    • 3.1. 修改机器名(所有节点)
      • 3.1.1. 修改机器名称
      • 3.1.2. 配置hosts
      • 3.1.3. 设置防火墙(所有节点)
    • 3.2. 配置免密码登录SSH
      • 3.2.1启动SSH服务命令(root用户)
      • 3.2.2生成SSH公匙(root用户)
      • 3.2.3验证安装(root用户)
    • 3.3. 关闭SELINUX(所有节点)
    • 3.4. 修改Linux内核参数(所有节点)
    • 3.5. 关闭透明大页面:
    • 3.6. 修改文件句柄数:
    • 3.7. 配置NTP服务
    • 3.8. 安装依赖包(所有)
    • 3.9. 安装oracle JDK1.8 (所有节点)
    • 3.10. Mysql安装(主节点)
      • 3.10.1 mariadb安装
      • 3.10.2 启动mariadb
      • 3.10.3 配置mysql
  • 4.安装CM
    • 4.1. 传包,解包(所有)
    • 4.2. 创建用户(所有)
    • 4.3. 拷贝mysql-jar包
    • 4.4. 创建数据库(主节点)
    • 4.5. 制作本地Parcel目录(主从)
    • 4.6. 修改cloudera-scm-agent配置(所有)
    • 4.7. 启动CM Server和Agent(主从)
  • 5.登陆CM Server完成集群安装
  • 6.CDH集群安装检查
  • 7.参考文献

1. 安装总概

1.1. 软件环境

本文将介绍Centos7.2离线安装CDH和Cloudera Manager过程,软件版本如下表1-1所示:

表1-1 软件版本选取
NO. 软件名称 版本
1 操作系统 Centos7.2
2 JDK jdk-11.0.1_linux-x64
3 Clouder Manager 5.15.0
4 CDH 5.15.0
5 数据库 MariaDB

1.2. 配置规划

本次安装共4台服务器,服务器配置及用途如下表1-2所示:

表1-2 服务器基本规划配置
NO. 机器名称 内网 IP 核/内存/硬盘 用途
1 mater 192.168.8.5 32C/64G/500GB CM,Mysql主
2 slave1 192.168.8.6 32C/64G/500GB AG,slave1
3 slave2 192.168.8.7 32C/64G/500GB AG,slave2
4 slave3 192.168.8.8 32C/64G/500GB AG,slave3

1.3. CheckList

本部分是讲述,安装过程的checklist,也就是安装步骤总览,如表1-3所示:

NO. 类别 项目 当前进度
1 资源 校核操作系统 Centos7.2 64 位
2 资源 资源下载 Jdk+cm+cdh
3 Linux Hostname-Hosts 互ping
4 Linux Net-tools 能够使用ifconfig和netstat
5 Linux 防火墙,selinux 关闭成功
6 Linux NTP对时 全主时间硬件更新
7 Linux SSH免密 SSH(master对其他)
8 Linux Swappiness小于10 修改成功
9 Linux 文件句柄改大 修改不成功
10 Linux 透明大页面关闭 修改成功
11 Soft 依赖包 安装成功
12 Soft Jdk 安装成功
13 Soft MySQL root#root, navicat连接成功
14 CM-资源 JDBC,CM,CDH 移到/data/cdh
15 CM-资源 解压,传包 包含Mysql-jar
16 CM-安装 Linux用户创建 完成
17 CM-安装 CDH-数据库初始化 Navicat查看
18 CM-安装 Parcel目录 主从完成
19 CM-安装 配置 修改config.ini
20 CDH-基本 基本组件 安装完成

2. 软件资源

2.1. JDK环境:

JDK版本:jdk-11.0.1_linux-x64
jdk-11.0.1_linux-x64_bin.tar.gz
下载地址:
http://download.oracle.com/otn-pub/java/jdk/11.0.1+13/90cf5d8f270a4347a95050320eef3fb7/jdk-11.0.1_linux-x64_bin.tar.gz

2.2. scala环境:

scala-2.11.8.rpm
下载地址:
https://downloads.lightbend.com/scala/2.11.8/scala-2.11.8.rpm

2.3. CM包:

CM版本:5.15.0
cloudera-manager-centos7-cm5.15.0_x86_64.tar.gz
下载地址:
http://archive-primary.cloudera.com/cm5/cm/5/cloudera-manager-centos7-cm5.15.0_x86_64.tar.gz

2.4. CDH包

CDH版本:5.15.0,
CDH-5.15.0-1.cdh5.15.0.p0.21-el7.parcel
CDH-5.15.0-1.cdh5.15.0.p0.21-el7.parcel.sha1
下载地址:
http://archive-primary.cloudera.com/cdh5/parcels/5.15.0/CDH-5.15.0-1.cdh5.15.0.p0.21-el7.parcel
http://archive-primary.cloudera.com/cdh5/parcels/5.15.0/CDH-5.15.0-1.cdh5.15.0.p0.21-el7.parcel.sha1

2.5 manifest.json

下载地址:
http://archive-primary.cloudera.com/cdh5/parcels/5.15.0/manifest.json
备注:另存为文件即可

2.6. JDBC连接jar包:

jar包版本:5.1.43,
mysql-connector-java-5.1.43.jar
下载地址:
http://central.maven.org/maven2/mysql/mysql-connector-java/5.1.43/mysql-connector-java-5.1.43.jar

3.环境配置

3.1. 修改机器名(所有节点)

3.1.1. 修改机器名称

第一个节点修改信息如下,其他节点分别修改为slave1/slave2/slave3

hostnamectl set-hostname master //设置机器名
hostname // 查看本机名

这种方式,在Centos7中可以永久性改变主机名称。

3.1.2. 配置hosts

需要确保hostname唯一,同一个CDH集群内不能存在两个hostname相同的节点,否
则会出现异常;另外,hostname不能包含特殊字符,比如“_”,否则安装Cloudera
Manager Server时会报找不到主机的异常;如果hostname包含字母,建议全部使用小写
字母。

操作系统默认是通过/etc/hosts文件进行IP地址的解析,主要是定义主机名和IP地址的映射
关系,如果没配置DNS,集群所有节点都要有至少包含本集群所有节点的hosts文件
所有节点均修改/etc/hosts文件,新增如下IP与主机名的对照关系

vim /etc/hosts 

内容都改为:

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.8.5 master
192.168.8.6 slave1
192.168.8.7 slave2
192.168.8.8 slave3

3.1.3. 设置防火墙(所有节点)

需要在所有的节点上执行,因为涉及到的端口太多了,临时关闭防火墙是为了安装起来更方便,安装完毕后可以根据需要设置防火墙策略,保证集群安全。

需要确保集群内所有节点能够互相访问,通常情况下,会永久关闭防火墙。如果企业在安全方面要求较为严格的话,比如银行、运营商,可能需要启用主机防火墙,配置相应的防火墙策略,只开放某些机器对某些必要端口的访问权限,比如ssh服务的22端口,agent的7190端口。
防火墙常用命令:

systemctl status firewalld.service(查询防火墙状态)
systemctl stop firewalld.service (关闭防火墙)
systemctl start firewalld.service (开启防火墙)
systemctl disable firewalld.service (禁止firewall开机启动)

3.2. 配置免密码登录SSH

3.2.1启动SSH服务命令(root用户)

service sshd restart

重启SSH

rpm -qa | grep openssh

检查SSH是否安装成功,如果出现下面的信息:

openssh-server-6.6
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: aarch64是一种基于ARM架构的64位处理器架构,它提供了更高的性能和更低的功耗,因此越来越多的厂商和用户选择使用aarch64平台搭建大数据处理和存储的基础设施。 CDH(Cloudera Distribution for Hadoop)是一种基于Hadoop生态系统的大数据处理平台,它提供了包括Hadoop、Spark、Hive、HBase等多个组件,用于处理海量的结构化和非结构化据。 搭建aarch64架构的CDH平台需要以下步骤: 1. 硬件选择:选择适合aarch64架构的服务器和存储设备,例如市场上的aarch64服务器,确保硬件支持aarch64系统。 2. 操作系统选择:选择支持aarch64架构的操作系统,如CentOS、Ubuntu等Linux发行版。可以从官方网站下载aarch64架构适用的操作系统镜像。 3. 安装JDK:在aarch64架构的服务器上安装适合的JDK(Java Development Kit),例如OpenJDK。可以通过包管理器或手动下载安装。 4. 下载CDH:从Cloudera官方网站下载适用于aarch64架构的CDH安装包,可以选择全套的CDH发行版或根据需求选择部分组件。 5. 解压安装包:将下载的CDH安装包解压到指定的目录,并设置环境变量,以便在任何位置都可以运行CDH命令和脚本。 6. 配置CDH:根据实际需求,修改CDH的配置文件,如hadoop-env.sh、hdfs-site.xml等,配置相关的参,如内存分配、据存储路径等。 7. 启动CDH:使用CDH提供的启动脚本,启动Hadoop、Spark等各个组件,确保它们能够正常运行并相互通信。 8. 测试CDH:使用各个组件提供的命令和接口,对CDH平台进行功能和性能测试,确保其稳定性和可用性。 总结起来,搭建aarch64架构的CDH平台需要选择适合的硬件、操作系统和JDK,下载CDH安装包并解压配置,最后启动各个组件并进行测试。这样可以搭建一个适用于aarch64架构的分布式大数据处理平台,满足海量据处理和存储的需求。 ### 回答2: AARCH64指的是一种64位的ARM处理器架构。搭建CDH(Cloudera Distribution including Apache Hadoop)主要是指在AARCH64处理器架构上建立CDH集群。 首先,需要在AARCH64处理器架构的机器上安装操作系统,如CentOS或Ubuntu。确保操作系统版本和内核支持AARCH64架构。 接下来,下载CDH软件包并解压。CDH由多个组件组成,包括Hadoop、Hive、HBase、Spark等。根据实际需要选择下载相应的组件。 在CDH集群中,至少需要一个主节点和多个工作节点。主节点负责协调集群中的各个组件,而工作节点执行实际的计算任务。 配置CDH集群的主节点,需要编辑相应的配置文件,如hdfs-site.xml、core-site.xml和mapred-site.xml。其中,hdfs-site.xml用于配置分布式文件系统(HDFS),core-site.xml用于配置Hadoop的核心设置,mapred-site.xml用于配置MapReduce任务的参。 配置工作节点的操作类似,也需要编辑相应的配置文件。 安装CDH集群的各个组件(如HDFS、Hive和HBase)需要按照官方文档的指引进行。 一般来说,在AARCH64架构上搭建CDH集群和在x86架构上搭建CDH集群的步骤是类似的,只是需要下载和配置适用于AARCH64架构的软件包。 最后,启动CDH集群并进行测试。可以使用hadoop fs命令测试HDFS是否正常工作,使用Hive或HBase进行据查询操作。 总之,搭建AARCH64上的CDH集群需要安装适用于AARCH64架构的操作系统和软件包,并进行相应的配置和安装操作。完成后,即可在AARCH64架构上运行CDH集群,并进行大数据处理任务。 ### 回答3: aarch64是一种基于ARM架构的64位处理器,而CDH是Cloudera发行的Hadoop生态系统的一个版本。搭建CDH集群需要以下步骤: 1. 硬件建议: 在搭建CDH之前,需要确保有足够的硬件资源。对于aarch64架构,建议至少配置2个以上的物理机器,每个机器至少拥有16个CPU核心、64GB内存和1TB的存储空间。此外,确保机器之间有高速网络连接。 2. 操作系统选择: 选择一个支持aarch64架构的操作系统作为基础。常用的操作系统有CentOS/RHEL、Ubuntu等,需要确保操作系统版本兼容aarch64架构。 3. 安装Java: CDH需要Java环境来运行,因此需要安装适用于aarch64架构的Java JDK。可以通过官方网站下载适用于aarch64的Java JDK,并按照指引进行安装。 4. 下载和安装CDH: 在Cloudera官方网站上下载适用于aarch64架构的CDH版本。解压下载的文件,并按照官方文档中的指引进行安装安装过程中需要指定CDH集群的配置参,如Master节点的IP地址、HDFS存储路径等。 5. 配置CDH集群: 安装CDH后,需要通过配置文件进行基本的集群配置。配置文件主要包括hadoop-env.sh、hdfs-site.xml、core-site.xml等。具体的配置参取决于集群规模和需求,按照官方文档配置相关参。 6. 启动CDH服务: 完成集群配置后,可以启动CDH服务。使用start-all.sh命令来启动所有CDH组件,包括HDFS、YARN、Hive等。在启动之前,需要确保所有机器上的服务都已正常配置并启动。 7. 验证CDH集群: 启动CDH服务后,可以通过浏览器访问Cloudera管理界面,验证CDH集群是否正常运行。在管理界面中,可以查看各个组件的运行状态、监控集群性能、运行MapReduce任务等。 通过以上步骤,可以在aarch64架构的硬件上搭建CDH集群,并利用该集群进行大数据处理和分析。需要注意的是,由于aarch64架构的特殊性,部分CDH组件可能需要对源代码进行编译或适配才能在该架构上正常运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值