Linux 大数据 HADOOP 02 --01


————>>书接Linux 大数据 HADOOP 01实验继续!!
有些公司不用hadoop但是用hdfs 为什么呢? 把hdfs当作存储用!

完全分布式
安装部署
• Hadoop 三大核心组件
– 分布式文件系统
– HDFS 已经部署完毕
– 分布式计算框架
– mapreduce
– 集群资源管理
– yarn
---------------------
安装部署
• 分布式计算框架 mapred-site.xml
– 改名
– FROM: mapred-site.xml.template

To: mapred-site.xml
– 资源管理类
– mapreduce.framework.name
------------------------------------------------------


【一】系统规划

主机                       角色             软件
192.168.4.10        master NameNode
                SecondaryNameNode        YARN
                ResourceManager HDFS
                                
192.168.4.11        node1 DataNode
                NodeManager HDFS        YARN    
                                
192.168.4.12        node2 DataNode
                NodeManager HDFS        YARN

192.168.4.13        node3 DataNode
                NodeManager HDFS        YARN
--------------------
hadoop有个特征,所有节点的都一样,所以在一台上配置,同步到其它机器上!!!

【二】• 分布式计算框架 mapred-site.xml
– 改名
– FROM: mapred-site.xml.template

To: mapred-site.xml
– 资源管理类
– mapreduce.framework.name

------------------------------------------

[root@nn01 ~]# cd /usr/local/hadoop/
[root@nn01 hadoop]# ls
[root@nn01 hadoop]# cd etc/hadoop/
[root@nn01 hadoop]# pwd
/usr/local/hadoop/etc/hadoop

[root@nn01 hadoop]# cp mapred-site.xml.template mapred-site.xml  ## 改成xml 因为xml才是有效的!
[root@nn01 hadoop]# vim mapred-site.xml                          ##mapred-site.xml 配置
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
---------------------------------
安装部署
• 分布式计算框架 mapred-site.xml
– 只支持 local 和 yarn 两种
– 单机使用 local
– 集群使用 yarn
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
--------------------
安装部署
• 资源管理 yarn-site.xml
– resourcemanager 地址

– yarn.resourcemanager.hostname
– nodemanager 使用哪个计算框架
– yarn.nodemanager.aux-services
– mapreduce_shuffle 是我们使用计算框架的名称
--------------
安装部署
【 三 】• 资源管理 yarn-site.xml
– yarn-site.xml 配置

[root@nn01 hadoop]# vim yarn-site.xml             ## yarn-site.xml 配置
<configuration>

<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>nn01</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

【四】 同步配置到其它主机(可以写成一个脚本方便执行!)

[root@nn01 ~]# for i in node{1..3};do rsync -aSH --delete /usr/local/hadoop ${i}:/usr/local/ -e 'ssh' & done

或者: 用脚本执行!!
[root@nn01 hadoop]# rrr
[root@nn01 hadoop]# 
[root@nn01 hadoop]# cat /usr/local/bin/rrr 
#!/bin/bash
for i in $@;do
    rsync -aSH --delete /usr/local/hadoop/etc ${i}:/usr/local/hadoop/ -e 'ssh' &
done
wait
[root@nn01 hadoop]# rrr node{1..3}
----------------
【 五 】  安装部署
• 启劢服务
– /usr/local/hadoop/sbin/start-yarn.sh
• 验证服务
– /usr/local/hadoop/bin/yarn node -list
[root@nn01 hadoop]# ./bin/yarn node –list


[root@nn01 hadoop]# cd /usr/local/hadoop/
[root@nn01 hadoop]# ls
[root@nn01 hadoop]# ./sbin/start-yarn.sh    ##-------> 启动yarn 

[root@nn01 hadoop]# ./sbin/start-dfs.sh     ##------->启动hdfs

也可以
[root@nn01 hadoop]# cat ./sbin/start-all.sh  ##这个脚本可以同时启动hdfs  yarn
这个脚本内容放在比较最后面! 

【六】 验 证 
启动完成以后成功是否,第一步查看进程起来吗  是否启动成功, 看角色!

[root@nn01 hadoop]# jps      ##—--> 看自己的角色
12355 SecondaryNameNode
13348 Jps
12168 NameNode
13087 ResourceManager

[root@nn01 hadoop]# for i in node{1..3};do      ## 看节点的角色!       
> ssh ${i} jps
> done
11473 Jps
11367 NodeManager
11085 DataNode
11057 DataNode
11427 Jps
11321 NodeManager
11233 NodeManager
10966 DataNode
11342 Jps
#可以看到三台NodeManager  三台DataNode#
或者这样 更容易分的清楚!!
[root@nn01 hadoop]# for i in node{1..3};do echo "#-----${i}-----#";ssh ${i} jps; done
#-----node1-----#
11492 Jps
11367 NodeManager
11085 DataNode
#-----node2-----#
11057 DataNode
11446 Jps
11321 NodeManager
#-----node3-----#
11233 NodeManager
11361 Jps
10966 DataNode
--------------------------------
#进程起来了不代表 这个集群组建成功了,需要进行网络通信,只有网络通信认证成功以后,才能确定集群成功了。
##  NN1: 验证节点状态 验证节点状态 
[root@nn01 hadoop]# ./bin/yarn  ## 直接“回车”会看到帮助!!
[root@nn01 hadoop]# ./bin/yarn node -list   ## 看yarn的节点列表      

node1:35749            RUNNING           node1:8042                   0
node3:46247            RUNNING           node3:8042                   0
node2:32966            RUNNING           node2:8042                   0
[root@nn01 hadoop]# 
# 到此会看到集群的节点,集群配置完成! 就可以使用了!
                      
----------------------------------------
【七 】# web访问hadoop #

• 使用 web 访问hadoop
– namenode web页面(nn01)
– http://192.168.1.10:50070/

– secondory namenode web 页面(nn01)
– http://192.168.1.10:50090/

– datanode web 页面(node1,node2,node3)
– http://192.168.1.11:50075/web访问hadoop

• 使用 web 访问hadoop
– resourcemanager web页面(nn01)
– http://192.168.1.10:8088/

– nodemanager web 页面(node1,node2,node3)
– http://192.168.1.11:8042/
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值