配置完全hadoop

最新推荐文章于 2023-08-27 20:03:14 发布

joris30

最新推荐文章于 2023-08-27 20:03:14 发布

阅读量153

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/joris30/article/details/81270692

版权

大数据专栏收录该内容

10 篇文章 0 订阅

订阅专栏

伪分布是namenode和datanode都在一台机器上；

完全节点是分布在不同机器上。

对于开发人员而言，为了模拟完全hadoop，可以通过克隆虚拟机来实现多机并发。

克隆：完全克隆，不是克隆链接。注意CPU上限、共享文件1

克隆出多台后，分别配置主机名和ip，主机名在/etc/hostname上；为了能映射主机名和ip，同时也需要修改/etc/hosts

然后 service network restart

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

为了能无密登录各台机器，需要进行以下三步：

1.删除每台机器上/home/username/.ssh/*

可以通过ssh命令，ssh s137 rm -rf /home/wangcong/.ssh/*

2.在namenode机器上，生成秘钥对：

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

3.将namenode上的公钥传到各台datanode上的~/.ssh的authorized_keys中（包括自己）

scp id_rsa.pub wangcong@s138:/home/wangcong/.ssh/authorized_keys

authorized_keys的权限除了自己别人都不能写

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
更改三个.xml"

<?xml version="1.0"?>

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://s136/</value>
</property>
</configuration>

<?xml version="1.0"?>

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>/disk1/hdfs/name,/remote/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/disk1/hdfs/data,/disk2/hdfs/data</value>
</property>
<property>
<name>dfs.namenode.checkpoint.dir</name>
<value>/disk1/hdfs/namesecondary,/disk2/hdfs/namesecondary</value>
</property>
</configuration>

<?xml version="1.0"?>

<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>resourcemanager</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/disk1/nm-local-dir,/disk2/nm-local-dir</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce.shuffle</value>
</property>
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>16384</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>16</value>
</property>
</configuration>