目录
- 概念
- 集群服务器准备
1)主要配置步骤
2)环境版本
3)配置网络环境
4)配置基础环境(ssh、npt)
- 集群服务器规划
- 软件安装步骤概述
1)jdk
2)mysql
- Hadoop安装(可以采用ambari方式部署)
- hadoop简单测试使用
一、概念了解
主从结构分类:
一主多从
多主多从
Hadoop中的hdfs和yarn都是主从结构:不同服务的概念不同
大数据开发(一)Hadoop集群搭建和简单应用 2018年11月21日 10:46
目录
1)主要配置步骤 2)环境版本 3)配置网络环境 4)配置基础环境(ssh、npt)
1)jdk 2)mysql
一、概念了解 主从结构分类: 一主多从 多主多从 Hadoop中的hdfs和yarn都是主从结构:不同服务的概念不同
二、集群服务器准备
确定你要安装的软件的版本 一个选取原则: 不新不旧的稳定版本
几个标准: 1)一般来说,刚刚发布的大版本都是有很多问题 2)应该选择某个大版本中的最后一个小版本
1)环境工具及规划
2)配置基础环境 主要是做以下几步:
具体操作可以参考普通分布式搭建过程 http://www.cnblogs.com/qingyunzong/p/8496127.html
三、集群服务器规划 使用3台 Centeos7 虚拟机进行集群搭建:
节点规划:yarn和hdfs的主节点主服务需要分开放
目录规划
四、软件安装步骤概述
(1) 上传压缩包 Xshell sftp 上传 hadoop压缩包
cd /home/hadoop/software tar -xzvf hadoop-2.7.7.tar.gz -C ~/apps/ (2)修改配置文件 配置文件目录:/home/hadoop/apps/hadoop-2.7.7/etc/hadoop 修改 hadoop-env.sh文件 :主要修改JAVA_HOME
(3)Hadoop初始化 注意:HDFS初始化只能在主节点上进行 hadoop namenode -format
(4)启动hdfs服务
注意:不管在集群中的那个节点都可以 start-dfs.sh
(5)启动yarn 注意:只能在yarn的主节点(yarn-site.xml 中配置的resourceManager的节点)上进行 start-yarn.sh
(6) 查看启动状态 Hadoop1
Hadoop2 hadoop3
(7)启动HDFS和YARN的web管理界面
HDFS : http://192.168.204.132:50070 YARN : http://192.168.204.130:8088 疑惑: fs.defaultFS = hdfs://hadoop02:9000 解答:客户单访问HDFS集群所使用的URL地址 同时,HDFS提供了一个web管理界面 端口:50070
六、Hadoop的简单使用 1、运行一个mapreduce的例子程序: wordcount
hadoop jar ~/apps/hadoop-2.7.7/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /test/input /test/output | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||