2024年大数据最全Hadoop安装部署手册_hadoop部署手册(3)

主机名IP用户名HDFSYARN
hadoop01172.16.126.71hadoopNameNodeResourceManager
hadoop02172.16.126.72hadoopDataNode、SecondaryNameNodeNodeManager
hadoop03172.16.126.61hadoopDataNodeNodeManager
hadoop04172.16.126.62hadoopDataNodeNodeManager

安装包下载地址: Index of /hadoop/common

2.初始化

1、配置主机名

举例:在hadoop01服务器上
#hostnamectl set-hostname hadoop01

2、编辑/etc/hosts

172.16.126.71 hadoop01
172.16.126.72 hadoop02
172.16.126.61 hadoop03
172.16.126.62 hadoop04

3、创建hadoop用户

创建用户
#useradd hadoop
重置hadoop密码
#passwd hadoop   

4、通过hadoop用户配置秘钥互信(hadoop01服务器执行即可)

创建秘钥
#ssh-keygen -t rsa
分发秘钥
#ssh-copy ssh-copy-id hadoop02
#ssh-copy ssh-copy-id hadoop03
#ssh-copy ssh-copy-id hadoop04

5、关闭selinux及防火墙

关闭selinux
# setenforce 0 && sed -i 's/^SELINUX=.*/SELINUX=disabled/' /etc/selinux/config
关闭防火墙
#systemctl stop firewalld &&systemctl disable firewalld 

6、 安装java

安装java可以采用yum安装或者手工配置的方式,这里采用yum安装

 yum install  jdk -y

7、解压hadoop-3.3.4.tar.gz安装包至/data/,并重命名为hadoop目录,实际部署目录是/data/hadoop/

#tar zxvf hadoop-3.3.4.tar.gz -C /data/
#mv /data/hadoop-3.3.4 /data/hadoop

8、配置环境变量/etc/profile,添加的内容如下:

export HADOOP_HOME=/data/hadoop/
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.342.b07-1.el7_9.x86_64/jre/
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin

环境变量添加完后加载环境变量

#source  /etc/profile

9、创建文件存储目录

hadoop01

#mkdir /data/hadoop/hdfs/full/dfs/name -p

hadoop02

#mkdir /data/hadoop/hdfs/full/dfs/namesecondary -p
#mkdir /data/hadoop/hdfs/full/dfs/data -p

hadoop03

#mkdir /data/hadoop/hdfs/full/dfs/data -p

hadoop04

#mkdir /data/hadoop/hdfs/full/dfs/data -p

3.配置

配置时需要修改“/data/hadoop/etc/hadoop”目录下的配置文件,其中HDFS涉及到的配置文件包括workers、core-site.xml、hdfs-site.xml,Yarn涉及到的配置文件包括yarn-site.xml, mapReduce 涉及到的配置文件包括mapred-site.xml、。

  1. 修改workers文件 该文件内容可以指定某几个节点作为数据节点,默认为localhost,将其删除并修改为如下内容:
hadoop02
hadoop03
hadoop04

2.修改core-site.xml文件

fs.defaultFS:指定namenode的hdfs协议的文件系统通信地址,可以指定一个主机+端口

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://hadoop01:9000</value>
        </property>
</configuration>

3.hdfs-site.xml文件

dfs.secondary.http.address:secondarynamenode运行节点的信息,应该和namenode存放在不同节点 dfs.repliction:hdfs的副本数设置,默认为3 dfs.namenode.name.dir:namenode数据的存放位置,元数据存放位置 dfs.datanode.data.dir:datanode数据的存放位置,block块存放的位置

    <property>
         <name>dfs.replication</name>
         <value>3</value>
    </property>
    <property>
         <name>dfs.namenode.name.dir</name>
         <value>/data/hadoop/hdfs/full/dfs/name</value>
    </property>
​
    <property>
         <name>dfs.datanode.data.dir</name>
         <value>/data/hadoop/hdfs/full/dfs/data</value>
    </property>
​
    <property>
         <name>dfs.namenode.secondary.http-address</name>
         <value>hadoop02:50090</value>
    </property>
​
    <property>
         <name>dfs.namenode.checkpoint.dir</name>
         <value>/data/hadoop/hdfs/full/dfs/namesecondary</value>
    </property>

4.修改mapred-site.xml文件 vim mapred-site.xml mapreduce.framework.name:指定mapreduce框架为yarn方式 mapreduce.jobhistory.address:指定历史服务器的地址和端口 mapreduce.jobhistory.webapp.address:查看历史服务器已经运行完的Mapreduce作业记录的web地址,需要启动该服务才行

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 19
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hadoop大数据实战手册》是一本关于Hadoop大数据处理的实用手册。本书主要介绍了Hadoop的基本概念、架构和工作原理,并提供了一系列实际案例和实战经验,帮助读者了解如何在实际项目中应用Hadoop技术解决大数据处理问题。 该书首先介绍了Hadoop的基本概念和组件,如HDFS、MapReduce和YARN。读者可以了解到Hadoop的分布式文件系统和计算模型,以及它们如何协同工作来处理和存储大规模数据。然后,该书介绍了Hadoop集群的搭建和配置,涵盖了硬件要求、网络设置、安全性等方面的内容,帮助读者从头开始构建自己的Hadoop集群。 接下来,本书列举了一些实际应用案例,涵盖了不同行业和领域,如电信、金融、医疗等。每个案例都详细介绍了问题的背景、解决方案的设计和实施步骤,以及使用Hadoop解决该问题的具体方法。通过这些案例,读者可以学习到如何使用Hadoop技术处理实际项目中的大数据。 此外,本书还介绍了一些Hadoop生态系统中的相关工具和框架,如Hive、HBase、Spark等。这些工具和框架可以提供更高级的数据分析和处理功能,使读者能够更好地应对大规模数据处理需求。 总之,《Hadoop大数据实战手册》是一本非常实用的学习资料,不仅介绍了Hadoop的基础知识,还提供了丰富的实际案例和经验,帮助读者深入理解和应用Hadoop技术解决大数据问题。无论是对于初学者还是有一定经验的开发者来说,这本书都是一本值得阅读的参考书。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值