基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop集群安装



一、Cloudera Manager/CDH5

1、关于cloudera manager和CDH是什么,这里不做详细介绍了。有官网和百科介绍。

附上官网地址:cloudera manager

2、官网的安装指南

官方文档提供了三种安装方式:在线自动安装/手动安装包安装/手动使用cloudera manager管理安装

此处使用第三种方式安装Hadoop集群。

二、环境规划

1、系统:CentOS 6.4_x86
• master:4G内存,硬盘尽量大容量
• slave1:2G内存,硬盘尽量大容量
• slave2:2G内存,硬盘尽量大容量

2、Cloudera Manager 5.3.3

3、CDH 5.3.3

安装包下载:
•Cloudera Manager 5.3.3:http://archive-primary.cloudera.com/cm5/cm/5/
•CDH 5.5.5:http://archive-primary.cloudera.com/cdh5/parcels/5.3.3/

下载软件包:
•CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel
•CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha1
•manifest.json

三、系统环境准备工作
•此次执行权限均为root用户
•所有的机器都必须ssh互信模式
•修改主机名使用hosts文件或者DNS服务器
•关闭iptables和selinux
•卸载系统自带的openjdk,安装Oracle的jdk
•master节点安装mysql
•所有节点的时间必须同步(ntp服务器或其他方法)
•修改所有节点的内核参数

i. echo 0 > /proc/sys/vm/swappiness

ii.echo never > /sys/kernel/mm/RedHat_transparent_hugepage/defrag

四、正式开始安装
1、cloudera manager默认的目录是在/opt下,解压到/opt目录下。
# tar xf cloudera-manager-el6-cm5.3.3_x86_64.tar.gz -C /opt/
# ls /opt/
cloudera  cm-5.3.3
#
# 安装mysql-connector-java
# yum -y install mysql-connector-java

2、初始化数据库
# /opt/cm-5.3.3/share/cmf/schema/scm_prepare_database.sh mysql cm -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm
# mysql -uroot -p123456 -e "show databases;"    查看下cm数据库是否创建成功

3、复制数据到其他节点
# 修改配置文件server_host为master节点的主机名
# grep server_host /opt/cm-5.3.3/etc/cloudera-scm-agent/config.ini
server_host=master
# scp -rp /opt/cm-5.3.3 slave1:/opt/
# scp -rp /opt/cm-5.3.3 slave2:/opt/
#
# 每个节点创建系统用户
# useradd --system --home=/opt/cm-5.3.3/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "cloudera scm user" cloudera-scm

4、数据库的配置
# hive
# create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
# active monitor
# create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
# 授权master主机
# grant all on *.* to 'root'@'master' identified by 'PASSWD';

5、准备parcels安装包到/opt/cloudera/parcel-repo/
# ls /opt/cloudera/parcel-repo/
CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel  CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha  manifest.json
# 注意:CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha下载后的文件重命名的
#
# 启动master节点的server和agent脚本
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-server start
# server端口启动较慢
#
# 启动其他所有节点的agent脚本
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start

五、CDH 5安装配置

1、访问http://master-ip:7180端口开始安装

1、访问http://master-ip:7180端口开始安装


登陆名:admin 密码:admin

2、选择一个版本进行安装,此处选择第一个免费版。然后下一步-->下一步


3、选中所有主机:

4、如果配置正确,会出现如下界面


5、然后继续下一步,由于我们已经下载了离线包,所以下载是很快就能完成的


6、主机检测,检测主机是否符合安装要求,符合要求后会全部通过,否则请按照要求设置


7、然后选择需要安装的软件包,可以全选或自定义,也可以选择集成了某一个组件功能的软件包来安装


8、角色分配,此处默认,可以按需调整


9、数据库测试:


10、审核更改参数,可以使用默认,也可以按需更改


11、启动正常的安装配置了,等待安装完成后再次访问主页即可。


12、完成后的登陆界面


由于主机性能较低,数据延迟很大,查询经常无法显示。而且由于此处的磁盘空间不足,所以有很多警告信息。到此安装已全部完成。

六、其他问题说明

oozie的web界面的开启:


cloudera的文档中有说明配置oozie:


安装这个操作即可:

# mv ext-2.2.zip /var/lib/oozie/

# cd /var/lib/oozie

# unzip ext-2.2.zip

刷新界面:


hadoop2.x版本更新了一些新功能,支持HDFS的高可用等。cloudera manager管理界面可以直接操作等这一系列的功能,还是很方便的。

在集群里的HDFS界面的右上角有操作选项栏:


点击后根据提示就能正常的配置了。管理界面添加移除集群中的主机也是非常方便的,具体的操作就不一一演示了。

七、Hadoop测试程序

# 计算pi值

# sudo -u hdfs hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 10 100

...

Job Finished in 126.439 seconds

Estimated value of Pi is 3.14800000000000000000

# 可以看到执行结果

可以在YARN的web界面看到详细job的信息


还有很多测试程序可以运行测试。这里就不一一演示了。

另外,这种安装方式虽然快捷方便,但是不利于对整体的理解,建议还是使用下载安装包的方式安装,配置文件等都是需要手动编写的,对于理解比较深刻。

Ubuntu14.04下Hadoop2.4.1单机/伪分布式安装配置教程  http://www.linuxidc.com/Linux/2015-02/113487.htm

CentOS安装和配置Hadoop2.2.0  http://www.linuxidc.com/Linux/2014-01/94685.htm

Ubuntu 13.04上搭建Hadoop环境 http://www.linuxidc.com/Linux/2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm

Ubuntu上搭建Hadoop环境(单机模式+伪分布模式) http://www.linuxidc.com/Linux/2013-01/77681.htm

Ubuntu下Hadoop环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm

单机版搭建Hadoop环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm

更多Hadoop相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

本篇文章来源于 Linux公社网站(www.linuxidc.com)  原文链接:http://www.linuxidc.com/Linux/2015-08/121405.htm


Stkcd [股票代码] ShortName [股票简称] Accper [统计截止日期] Typrep [报表类型编码] Indcd [行业代码] Indnme [行业名称] Source [公告来源] F060101B [净利润现金净含量] F060101C [净利润现金净含量TTM] F060201B [营业收入现金含量] F060201C [营业收入现金含量TTM] F060301B [营业收入现金净含量] F060301C [营业收入现金净含量TTM] F060401B [营业利润现金净含量] F060401C [营业利润现金净含量TTM] F060901B [筹资活动债权人现金净流量] F060901C [筹资活动债权人现金净流量TTM] F061001B [筹资活动股东现金净流量] F061001C [筹资活动股东现金净流量TTM] F061201B [折旧摊销] F061201C [折旧摊销TTM] F061301B [公司现金流1] F061302B [公司现金流2] F061301C [公司现金流TTM1] F061302C [公司现金流TTM2] F061401B [股权现金流1] F061402B [股权现金流2] F061401C [股权现金流TTM1] F061402C [股权现金流TTM2] F061501B [公司自由现金流(原有)] F061601B [股权自由现金流(原有)] F061701B [全部现金回收率] F061801B [营运指数] F061901B [资本支出与折旧摊销比] F062001B [现金适合比率] F062101B [现金再投资比率] F062201B [现金满足投资比率] F062301B [股权自由现金流] F062401B [企业自由现金流] Indcd1 [行业代码1] Indnme1 [行业名称1] 季度数据,所有沪深北上市公司的 分别包含excel、dta数据文件格式及其说明,便于不同软件工具对数据的分析应用 数据来源:基于上市公司年报及公告数据整理,或相关证券交易所、各部委、省、市数据 数据范围:基于沪深北证上市公司 A股(主板、中小企业板、创业板、科创板等)数据整理计算
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值