三台阿里云服务器搭建Hadoop3集群

1 前言

在讲述Hadoop集群搭建之前,首先要了解Hadoop和集群两个名词,Hadoop是由Apache基金会开发的分布式系统基础架构,简单理解就是大数据技术应用的基础。集群可以理解为多台装有hadoop的服务器。搭建Hadoop集群的目的就是为了管理多台服务器,使多台服务器之间能够协调工作。本文选择了3台阿里云服务器。从下图中可以对整个大数据架构有了大体的了解。

hadoop框架

Hadoop主要有HDFS(分布式文件存储系统)、Yarn(集群资源管理与调度)和MapReduce(分布式计算框架)组成。Hadoop集群中分为主机(master)和从机(slave),本文配置一台阿里云服务器为主机和从机。其余两台为从机。HDFS(分布式文件存储系统)在主机上称为Namenode节点,在从机上称为Datanode节点。Namenode维护HDFS的文件系统树以及文件树中所有的文件和文件夹的元数据。可以理解为win系统中文件夹属性中的那些信息,Datanode是存储和检索数据的地方。可以理解为win系统中文件夹中实际数据。

img

Yarn(集群资源管理与调度)在主机上称为ResourceManager节点,在从机上称为NodeManager。ResourceManager是全局的资源管理器,负责整个系统的资源管理和分配,NodeManager是节点上的资源和任务管理器。定时地向ResourceManager汇报本节点的资源使用情况。

MapReduce(分布式计算框架)顾名思义就是计算框架,有啥特点呢,就是分布式,可以把大型数据处理任务分解成很多单个简单的任务,然后再把各个处理结果合在一起。计算过程可以百度了解。

2 Hadoop集群搭建

image-20200920203945226

2.1 服务器系统设置

网上教程多采用虚拟机创建多个linux系统来搭建Hadoop集群,我觉得虚拟机有弊端就采用了阿里云服务器。阿里云服务器购买选配过程后续再介绍。

  • hosts文件修改

hosts是一个没有扩展名的系统文件,其基本作用就是将一些常用的网址域名与其对应的 IP 地址建立一个关联“ 数据库 ”。当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从hosts文件中寻找对应的 IP 地址,一旦找到,系统就会立即打开对应网页,如果没有找到,则系统会将网址提交 DNS 域名解析服务器进行 IP 地址的解析。就如你访问本地的时候,你输入127.0.0.1和localhost是一致的。hosts文件修改就是在添加三台服务器IP和域名的映射。

vi /etc/hosts

添加一下映射

172.27.
  • 5
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
要使用三台服务器搭建一个完全分布式Hadoop集群,你需要按照以下步骤进行操作: 1. 设置主机名和IP:在每台服务器上设置唯一的主机名和IP地址。 2. 配置主机的映射:在每台服务器上配置/etc/hosts文件,将每台服务器的主机名和IP地址进行映射。 3. SSH免密登录:在每台服务器上生成SSH密钥对,并将公钥复制到其他服务器上,以实现服务器之间的免密登录。 4. 关闭防火墙:在每台服务器上关闭防火墙,以确保Hadoop集群的正常通信。 5. 关闭SELinux:在每台服务器上禁用SELinux,以避免与Hadoop的正常运行产生冲突。 6. 安装JDK:在每台服务器上安装JDK,并设置JAVA_HOME环境变量。 7. 设置时间同步服务:在每台服务器上安装并配置NTP时间同步服务,以确保集群中所有服务器的时间同步。 8. 下载和安装Hadoop:在每台服务器上下载Hadoop的二进制文件,并解压到指定目录。你可以使用wget命令下载Hadoop的tar.gz文件,然后使用tar命令解压。 9. 配置Hadoop环境变量:在每台服务器上编辑hadoop-env.sh文件,设置Hadoop的环境变量,如JAVA_HOME、HADOOP_HOME等。 10. 配置Hadoop集群:在每台服务器上编辑core-site.xml、hdfs-site.xml和yarn-site.xml等配置文件,设置Hadoop集群的相关参数,如文件系统地址、副本数量、资源管理器地址等。 11. 启动Hadoop集群:在一台服务器上启动NameNode和ResourceManager,然后在其他服务器上启动DataNode和NodeManager。 请注意,以上步骤仅为概括,并不包含具体的配置细节。在实际操作中,你需要根据你的服务器环境和需求进行相应的配置。详细的操作步骤和配置参数可以参考Hadoop官方文档或其他教程资源。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [hadoop2.7.2分布式集群搭建(三台)](https://blog.csdn.net/PeiBoos/article/details/125914812)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [3台机器配置hadoop集群_Hadoop+Hbase 分布式集群架构](https://blog.csdn.net/wanghengwhwh/article/details/128567974)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值