hadoop完全分布式-1

最新推荐文章于 2021-03-10 17:31:49 发布

noodlesfate1

最新推荐文章于 2021-03-10 17:31:49 发布

阅读量250

点赞数 1

分类专栏： hadoop

本文链接：https://blog.csdn.net/noodlesfate1/article/details/51832317

版权

hadoop 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

查看log文件（重要），以后出现很多错误都要从此处查找
1 通过log文件查看
cd ${HADOOP_INSTALL}/logs
cat hadoop-ubuntu-namenode-bogon.log ; cat hadoop-ubuntu-namenode-bogon.out ///查看namenode的日志
cat hadoop-ubuntu-datanode-bogon.log ; cat hadoop-ubuntu-datanode-bogon.out
2 通过web UIs查看日志或者集群情况
http://localhost:50070/ ///for the namenode，可以在宿主机通过IP+端口号访问
http://localhost:8088/ ///for the resource manager，只能在本机访问，hadoop集群信息
http://localhost:19888/ ///for the history server
可以看到有端口，必然对应有侦听
netstat -lnpt
获取到虚拟机IP后，也可以在宿主机访问http://192.168.64.130:50070/
Overview里面localhost:8080为namenode的对外开放端口，用于与datanode进行连接
Datanodes里面50010为datanode与namenode进行交互的端口
必然涉及到socket编程，hadoop用的是netty框架,可以进到hadoop的安装目录下查看一下是不是有netty的jar包（cd ${HADOOP_INSTALL} find . | grep netty）
打开utilities，Browse the file system，输入/后可以看到整个hdfs文档目录及文件，目录是没有副本的，文件的副本数根据配置，128MB一个快，文件太大就会切割成多个块

hadoop fs -ls -R hdfs://hocalhost/ 等同于hadoop fs -ls -R / 等同于hadoop fs -ls -R hdfs:/ ///以hdfs协议查看文件目录
hadoop fs -ls -R file:/ ///以file:/协议查看文档，结果看到的是本地文档目录结构

查看log文件（重要），以后出现很多错误都要从此处查找
1 通过log文件查看
cd ${HADOOP_INSTALL}/logs
cat hadoop-ubuntu-namenode-bogon.log ; cat hadoop-ubuntu-namenode-bogon.out ///查看namenode的日志
cat hadoop-ubuntu-datanode-bogon.log ; cat hadoop-ubuntu-datanode-bogon.out
2 通过web UIs查看日志或者集群情况
http://localhost:50070/ ///for the namenode，可以在宿主机通过IP+端口号访问
http://localhost:8088/ ///for the resource manager，只能在本机访问，hadoop集群信息
http://localhost:19888/ ///for the history server
可以看到有端口，必然对应有侦听
netstat -lnpt
获取到虚拟机IP后，也可以在宿主机访问http://192.168.64.130:50070/
Overview里面localhost:8080为namenode的对外开放端口，用于与datanode进行连接
Datanodes里面50010为datanode与namenode进行交互的端口
必然涉及到socket编程，hadoop用的是netty框架,可以进到hadoop的安装目录下查看一下是不是有netty的jar包（cd ${HADOOP_INSTALL} find . | grep netty）
打开utilities，Browse the file system，输入/后可以看到整个hdfs文档目录及文件，目录是没有副本的，文件的副本数根据配置，128MB一个快，文件太大就会切割成多个块

hadoop fs -ls -R hdfs://hocalhost/ 等同于hadoop fs -ls -R / 等同于hadoop fs -ls -R hdfs:/ ///以hdfs协议查看文件目录
hadoop fs -ls -R file:/ ///以file:/协议查看文档，结果看到的是本地文档目录结构

搭建完全分布式hadoop集群
1、安装java
2、创建user
略
3、安装hadoop
略
4、配置SSH
略
5、格式化
略
6、启动进程
start-dfs.sh
start-yarn.sh
7、创建目录
8、配置hadoop
除了各种伪分布式配置的XML文档外，最重要的一个是slaves纯文本文件，一行一个机器，会运行datanode和nodemanager

伪分布式下的slaves写入的就是localhost

a)克隆虚拟机4台, 用hostname查看虚拟机的主机名，修改各主机名

su root

nano /etc/hostname

c)配置hadoop配置文件

${hadoop_install}etc/hadoop/*-site.xml

<configuration>
<property>
<name>fs.defaultFS</name>

<value>hdfs://localhost/</value> ///此处的localhost改为namenode主机名或者IP地址，一般主机名即可

</property>
</configuration>
<?xml version="1.0"?>

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value> ///此处的1改为3
</property>
</configuration>
<?xml version="1.0"?>

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
<?xml version="1.0"?>

<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value> ///此处改为namenode的主机名
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

注意修改下面的文件

s200

s300

s400

开机克隆机，收集到各ip地址，写一份hosts文件，scp到各个主机

d）远程复制/etc/hosts到远程主机的/etc/下

scp hosts root@s200:/etc/

noodlesfate1

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop完全分布式-1

查看log文件（重要），以后出现很多错误都要从此处查找1 通过log文件查看cd ${HADOOP_INSTALL}/logscat hadoop-ubuntu-namenode-bogon.log ; cat hadoop-ubuntu-namenode-bogon.out ///查看namenode的日志cat hadoop-ubuntu-datanode-bogon.l
复制链接

扫一扫