搭建CDH的本地镜像

CDH的镜像我们这里以5.0.5为例,从镜像或者说安装包的角度看,一共有3部分,

  1. cm5, 包括了clouder manager agnet以及daemon 甚至java在内的程序
  2. cdh5, 里面主要包括了支持的各种组件,比如zk的rpm等
  3. parcels,这个就是把cdh5里面的小的包包进行了大的组合,这样,拷贝和分发更容易了。

本片文章主要解决的问题是,在安装cdh的时候,由于本身cdh会对/etc/yum.repos.d下面写入cloudera-manager.repo,但是里面的地址是国外的,非常慢哦,而且还是https的,我们看看该如何搞定。

搞定CM5的镜像站点文件

  • 在本地同步远端站点文件
yum install yum-utils

将如下的repo放到一台centos 6机器里面
[cloudera-manager]
name = Cloudera Manager, Version 5.5.0
baseurl = https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.5.0/
gpgkey = https://archive.cloudera.com/redhat/cdh/RPM-GPG-KEY-cloudera
gpgcheck = 1

在任何文件夹,我们可以使用
reposync -r cloudera-manager我们就会得到我们想要的文件,而且进行了目录编排,这个稍后我们会进行调整。

假设我们有个目录/data/mirror,那么我们就可以
cd /data/mirror && mkdir -p cm5/redhat/6/x86_64/cm/5.5.0/ 

有了上面的文件就好多了,我们可以把之前下载的东西放到我们的上面的目录下面 
cd 已经下载的文件夹 
find . -name *.rpm | xargs -i mv {} /data/mirror/cm5/redhat/6/x86_64/cm/5.5.0/

有了rpm,我们就要创建repo文件夹了,
cd /data/mirror/cm5/redhat/6/x86_64/cm/5.5.0/ 
createrepo . 

这样我们的站点目录文件就准备好了。

对了,别忘了还有一个gpgcheck也要一起下载下来。
  • 创建站点
我们需要https
# 生成私钥
openssl genrsa -des3 -out private.key 2048

# 生成证书请求
openssl req -new -key private.key -out server.csr

# 生成服务器私钥,去掉密码
openssl rsa -in private.key -out server.key

# 使用私钥为证书请求签名,生成服务器签署的证书,
openssl x509 -req -in server.csr -out server.crt -outform pem -signkey server.key -days 3650

nginx配置如下:
server {
        listen 443 ssl;
        server_name archive.cloudera.com;

        #设置长连接
        keepalive_timeout   70;
        ssl_certificate     /etc/nginx/ssl.archive.cloudera.com/server.crt;
        ssl_certificate_key /etc/nginx/ssl.archive.cloudera.com/server.key;
        ssl_protocols       TLSv1 TLSv1.1 TLSv1.2;
        #ssl_ciphers         HIGH:!aNULL:!MD5;

        location / {
        root /data/mirror/;
                autoindex on;
        }
}
  • 客户端测试
yum --disablerepo=* --enablerepo=cloudera-manager makecache

看看如下的图片:

这里写图片描述

上图说明我们的CERT是无效的,其实这个地方只要我们在/etc/yum.conf中加入

sslverify=0

就可以了,看看:

这里写图片描述

搞定DNS

这个地方我们就要试试dnsmasq了

  • 首先,搭建一个服务
yum install -y dnsmasq

配置文件中,我们需要指定一个
addn-hosts=/etc/hosts2

看看这个文件里面有啥,
192.168.126.102 hadoop-master.ops.ac.cn hadoop-master
192.168.126.103 hadoop-node-1.ops.ac.cn hadoop-node-1
192.168.126.101 hadoop-node-2.ops.ac.cn hadoop-node-2
192.168.3.228   archive.cloudera.com
  • DNS测试

客户端的东西就不用说了吧,我们只需要/etc/resolv.conf里面修改dns地址就好了,如下

server 192.168.3.228

测试

这里写图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: aarch64是一种基于ARM架构的64位处理器架构,它提供了更高的性能和更低的功耗,因此越来越多的厂商和用户选择使用aarch64平台搭建大数据处理和存储的基础设施。 CDHCloudera Distribution for Hadoop)是一种基于Hadoop生态系统的大数据处理平台,它提供了包括Hadoop、Spark、Hive、HBase等多个组件,用于处理海量的结构化和非结构化数据。 搭建aarch64架构的CDH平台需要以下步骤: 1. 硬件选择:选择适合aarch64架构的服务器和存储设备,例如市场上的aarch64服务器,确保硬件支持aarch64系统。 2. 操作系统选择:选择支持aarch64架构的操作系统,如CentOS、Ubuntu等Linux发行版。可以从官方网站下载aarch64架构适用的操作系统镜像。 3. 安装JDK:在aarch64架构的服务器上安装适合的JDK(Java Development Kit),例如OpenJDK。可以通过包管理器或手动下载安装。 4. 下载CDH:从Cloudera官方网站下载适用于aarch64架构的CDH安装包,可以选择全套的CDH发行版或根据需求选择部分组件。 5. 解压安装包:将下载的CDH安装包解压到指定的目录,并设置环境变量,以便在任何位置都可以运行CDH命令和脚本。 6. 配置CDH:根据实际需求,修改CDH的配置文件,如hadoop-env.sh、hdfs-site.xml等,配置相关的参数,如内存分配、数据存储路径等。 7. 启动CDH:使用CDH提供的启动脚本,启动Hadoop、Spark等各个组件,确保它们能够正常运行并相互通信。 8. 测试CDH:使用各个组件提供的命令和接口,对CDH平台进行功能和性能测试,确保其稳定性和可用性。 总结起来,搭建aarch64架构的CDH平台需要选择适合的硬件、操作系统和JDK,下载CDH安装包并解压配置,最后启动各个组件并进行测试。这样可以搭建一个适用于aarch64架构的分布式大数据处理平台,满足海量数据处理和存储的需求。 ### 回答2: AARCH64指的是一种64位的ARM处理器架构。搭建CDHCloudera Distribution including Apache Hadoop)主要是指在AARCH64处理器架构上建立CDH集群。 首先,需要在AARCH64处理器架构的机器上安装操作系统,如CentOS或Ubuntu。确保操作系统版本和内核支持AARCH64架构。 接下来,下载CDH软件包并解压。CDH由多个组件组成,包括Hadoop、Hive、HBase、Spark等。根据实际需要选择下载相应的组件。 在CDH集群中,至少需要一个主节点和多个工作节点。主节点负责协调集群中的各个组件,而工作节点执行实际的计算任务。 配置CDH集群的主节点,需要编辑相应的配置文件,如hdfs-site.xml、core-site.xml和mapred-site.xml。其中,hdfs-site.xml用于配置分布式文件系统(HDFS),core-site.xml用于配置Hadoop的核心设置,mapred-site.xml用于配置MapReduce任务的参数。 配置工作节点的操作类似,也需要编辑相应的配置文件。 安装CDH集群的各个组件(如HDFS、Hive和HBase)需要按照官方文档的指引进行。 一般来说,在AARCH64架构上搭建CDH集群和在x86架构上搭建CDH集群的步骤是类似的,只是需要下载和配置适用于AARCH64架构的软件包。 最后,启动CDH集群并进行测试。可以使用hadoop fs命令测试HDFS是否正常工作,使用Hive或HBase进行数据查询操作。 总之,搭建AARCH64上的CDH集群需要安装适用于AARCH64架构的操作系统和软件包,并进行相应的配置和安装操作。完成后,即可在AARCH64架构上运行CDH集群,并进行大数据处理任务。 ### 回答3: aarch64是一种基于ARM架构的64位处理器,而CDHCloudera发行的Hadoop生态系统的一个版本。搭建CDH集群需要以下步骤: 1. 硬件建议: 在搭建CDH之前,需要确保有足够的硬件资源。对于aarch64架构,建议至少配置2个以上的物理机器,每个机器至少拥有16个CPU核心、64GB内存和1TB的存储空间。此外,确保机器之间有高速网络连接。 2. 操作系统选择: 选择一个支持aarch64架构的操作系统作为基础。常用的操作系统有CentOS/RHEL、Ubuntu等,需要确保操作系统版本兼容aarch64架构。 3. 安装Java: CDH需要Java环境来运行,因此需要安装适用于aarch64架构的Java JDK。可以通过官方网站下载适用于aarch64的Java JDK,并按照指引进行安装。 4. 下载和安装CDH: 在Cloudera官方网站上下载适用于aarch64架构的CDH版本。解压下载的文件,并按照官方文档中的指引进行安装。安装过程中需要指定CDH集群的配置参数,如Master节点的IP地址、HDFS存储路径等。 5. 配置CDH集群: 安装完CDH后,需要通过配置文件进行基本的集群配置。配置文件主要包括hadoop-env.sh、hdfs-site.xml、core-site.xml等。具体的配置参数取决于集群规模和需求,按照官方文档配置相关参数。 6. 启动CDH服务: 完成集群配置后,可以启动CDH服务。使用start-all.sh命令来启动所有CDH组件,包括HDFS、YARN、Hive等。在启动之前,需要确保所有机器上的服务都已正常配置并启动。 7. 验证CDH集群: 启动CDH服务后,可以通过浏览器访问Cloudera管理界面,验证CDH集群是否正常运行。在管理界面中,可以查看各个组件的运行状态、监控集群性能、运行MapReduce任务等。 通过以上步骤,可以在aarch64架构的硬件上搭建CDH集群,并利用该集群进行大数据处理和分析。需要注意的是,由于aarch64架构的特殊性,部分CDH组件可能需要对源代码进行编译或适配才能在该架构上正常运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值