2021-03-26

最新推荐文章于 2024-07-09 09:58:57 发布

weixin_48167566

最新推荐文章于 2024-07-09 09:58:57 发布

阅读量79

点赞数

文章标签： hadoop hdfs mapreduce

本文链接：https://blog.csdn.net/weixin_48167566/article/details/115246492

版权

ROOT:Hadoop123
atguigu:atguigu/123456
内存2G，硬盘50G
1. 安装好linux
    /boot 200M
    /swap 2g
    / 剩余
2. *安装VMTools
3. 关闭防火墙
   sudo systemctl stop firewalld
   sudo systemctl disable firewalld
4. 设置静态IP，改主机名
    编辑vim /etc/sysconfig/network-scripts/ifcfg-eth0（阿里云此处不修改）
    改成
=================================
DEVICE=eth0
TYPE=Ethernet
ONBOOT=yes
BOOTPROTO=static
NAME="eth0"
IPADDR=192.168.5.101
PREFIX=24
GATEWAY=192.168.5.2
DNS1=192.168.5.2
=================================
编辑vim /etc/sysconfig/network
改HOSTNAME=那一行
5. 配置/etc/hosts增加私网IP，在c盘C:\Windows\System32\drivers\etc中hosts文件中增加公网IP（阿里云服务器）
    vim /etc/hosts
=============================
39.101.171.194 172.26.89.117
39.101.177.65 172.26.89.119
39.99.145.17   172.26.89.118
=============================
6. 创建一个一般用户atguigu，给他配置密码
    useradd atguigu
    passwd atguigu
7. 配置这个用户为/etc/sudoers，          sudo vi /etc/sudoers
    在root    ALL=(ALL)       ALL
    添加atguigu    ALL=(ALL)       NOPASSWD:ALL
    保存时wq！保存
8. 在/opt目录下创建两个文件夹module和software，并把所有权赋给atguigu
    mkdir /opt/module /opt/software
    chown atguigu:atguigu /opt/module /opt/software
从这里开始要以一般用户登陆
9. 搞一个分发脚本
    cd ~
    vim xsync
    内容如下：
=================================================================
#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
    echo Not Enough Arguement!
    exit;
fi
#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
do
    echo ====================    $host    ====================
    #3. 遍历所有目录，挨个发送
    for file in $@
    do
        #4 判断文件是否存在
        if [ -e $file ]
        then
            #5. 获取父目录
            pdir=$(cd -P $(dirname $file); pwd)

            #6. 获取当前文件的名称
            fname=$(basename $file)

ssh $host "mkdir -p $pdir"
            rsync -av $pdir/$fname $host:$pdir

        else
            echo $file does not exists!
        fi
    done
done
==============================================================
chmod +x xsync
mkdir /bin
sudo cp xsync /bin
sudo xsync /bin/xsync
10. 配置免密登陆（阿里云免密）
如果有ssh文件需要先删除及可：rm -rf .ssh
   1.生成密钥对       ssh-keygen -t rsa 三次回车
   2. 发送公钥到本机 ssh-copy-id hadoop102 输入一次密码（如果没有生成authorized_keys文件，则要先cat id_rsa.pub中把公钥拷贝，再vim authorized_keys编辑这个文件并把公钥粘贴过来）
   3.ssh 登录一下本机
      ssh hadoop102
      exit
4.在hadoop103和hadoop104上重复1-3步骤
5.在hadoop102上将authorized_keys中的AAA........atguigu@hadoop102复制
6.在hadoop103和hadoop104的zuthorized_keys中将hadoop102上authorized_keys中的AAA........atguigu@hadoop102粘贴并保存 :wq
7. 在hadoop102上分别ssh登陆一下所有虚拟机
        ssh hadoop103
        exit
        ssh hadoop104
        exit
8.root用户及atguigu用户，hadoop103以及hadoop104重复上述1-7步骤即可（如果SSH被拒绝则修改#chmod 700 /home/Hadoop/.ssh
#chmod 644 /home/Hadoop/.ssh/authorized_keys）
11. 解压hadoop以及JDK
        tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/
        tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/
进行分发hadoop及JDK xsync hadoop-3.1.3/ jdk1.8.0_212/
12. 配置环境变量
*在/etc/profile.d文件夹下新建一个sh文件，内容如下sudo vim /etc/profile.d/my_env.sh
=======================================================
#JAVA_HOME
JAVA_HOME=/opt/module/jdk1.8.0_212
PATH=$PATH:$JAVA_HOME/bin
#HADOOP_HOME
HADOOP_HOME=/opt/module/hadoop-3.1.3
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export PATH JAVA_HOME HADOOP_HOME
========================================================
source /etc/profile 或是重启xshell窗口，让环境变量生效
sudo xsync /etc/profile.d/my_env.sh
13.cd /opt/module/hadoop-3.1.3/etc/hadoop/
vim hadoop-env.sh
==================================================================
export JAVA_HOME=/opt/module/jdk1.8.0_212
==================================================================
14 . cd hadoop-3.1.3/etc/hadoop/
   vim core-site.xml
================================================================================

    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:9820</value>
</property>

    <property>
        <name>hadoop.data.dir</name>
        <value>/opt/module/hadoop-3.1.3/data</value>
</property>

    <property>
        <name>hadoop.proxyuser.atguigu.hosts</name>
        <value>*</value>
</property>

    <property>
        <name>hadoop.proxyuser.atguigu.groups</name>
        <value>*</value>
</property>

    <property>
        <name>hadoop.proxyuser.atguigu.users</name>
        <value>*</value>
    </property>
</configuration>
===================================================================================
vim hdfs-site.xml
===================================================================================

<property>
    <name>dfs.namenode.name.dir</name>
    <value>file://${hadoop.data.dir}/name</value>
</property>

<property>
    <name>dfs.datanode.data.dir</name>
    <value>file://${hadoop.data.dir}/data</value>
</property>
   
<property>
    <name>dfs.namenode.checkpoint.dir</name>
    <value>file://${hadoop.data.dir}/namesecondary</value>
</property>
    
    <property>
    <name>dfs.client.datanode-restart.timeout</name>
    <value>30s</value>
</property>

<property>
<name>dfs.namenode.http-address</name>
<value>hadoop102:9870</value>
</property>

<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop104:9868</value>
</property>

<property>
        <name>dfs.permissions.enabled</name>
        <value>false</value>
</property>
===========================================================================
vim yarn-site.xml
===============================================================================
   
   <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
     
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop103</value>
</property>

    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>

<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
</property>
==============================================================================
vim mapred-site.xml
===================================================================================

<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>

<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>

<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop102:19888</value>
</property>
======= ==================================================================================
15. cd /opt/module/hadoop-3.1.3/etc
xsync hadoop/
16. 格式化Namenode 在hadoop102
    hdfs    namenode   -format
17.单点启动hdfs：
hdfs --daemon start namenode（在102上启动）
hdfs --daemon start datanode（在102,103,104上启动）
hdfs --daemon start secondarynamenode（在104 上启动）
单点启动yarn：
yarn --daemon start resourcemanager（在103上启动）
yarn --daemon start nodemanager（在102,103,104上启动）
18.sudo vim /opt/module/hadoop-3.1.3/etc/hadoop/workers
================================================================================================
hadoop102
hadoop103
hadoop104
===================================================================================================
xsync /opt/module/hadoop-3.1.3/etc/hadoop/workers
19. 启动hdfs
    start-dfs.sh

20. 在配置了Resourcemanager机器上执行
在Hadoop103上启动start-yarn.sh

21 关 stop-dfs.sh stop-yarn.sh

如果集群出了问题
    stop-dfs.sh
    stop-yarn.sh
    #三台机器都要执行
    cd hadoop-3.1.3/etc/hadoop/
    rm -rf data logs
    回到16
22 启动历史服务器：mapred --daemon start historyserver（在hadoop102）

weixin_48167566

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-03-26

ROOT:Hadoop123atguigu:atguigu/123456内存2G，硬盘50G1. 安装好linux /boot 200M /swap 2g / 剩余 2. *安装VMTools3. 关闭防火墙 sudo systemctl stop firewalld sudo systemctl disable firewalld4. 设置静态IP，改主机名编辑vim /etc/sysconfig/network-scripts/ifcfg-...
复制链接

扫一扫