使用不同的云服务器搭建Hadoop集群

前言

本次使用的云服务器分别是:阿里云服务器、华为云服务器以及百度云服务器。配置均为2核4G1M,仅作为学习使用。


软件方面:
xshell6
xtp6
jdk1.8
hadoop3.1.3

节点名称
阿里云:node1
华为云:node2
百度云:node3

服务器基本配置


创建好实例后,首先要进行连接。本实验使用的是xshell6连接工具。这里以阿里云为例。

  1. 打开云服务控制台,找到IP地址,记录公网和私网IP;在这里插入图片描述

    通俗来说公网IP相当于你的身份证,是唯一的;私网IP相当于你的姓名,在你们家是唯一的,但是在外面可能有很多人和你重名。

  2. 打开xshell工具,新建会话,将公网IP填入主机;在这里插入图片描述
  3. 第一次登录时,用户名为root,密码为创建实例时输入的密码。如果忘记密码,可以重置。在这里插入图片描述
  4. 重复以上步骤,先用shell工具连接三台实例;
  5. 登录成功后,先修改主机名。然后配置/etc/hosts文件。配置时需注意,在哪台实例上,就把该实例的私网IP和其他实例的公网IP写入;
    # 在三台实例上分别修改主机名
    [root@xasdfaffefsgfgerere ~]$ hostnamectl set-hostname node1 # 阿里云实例
    [root@fsdgdgnfhfhhdgfggsf ~]$ hostnamectl set-hostname node2 # 华为云实例
    [root@dsfsfghfyjkjgjgghfh ~]$ hostnamectl set-hostname node3 # 百度云实例
    # 修改主机名后重新连接xshell即可看到更改后的主机名。
    
    # 配置hosts文件,让三台实例互相识别
    [root@node1 ~]$ vim /etc/hosts
    
    在这里插入图片描述
    在三台实例上依次执行以上步骤。执行完成后进行验证:在三台实例上分别执行:
    [root@node1 ~]$ ping node1
    [root@node1 ~]$ ping node2
    [root@node1 ~]$ ping node3
    
    在这里插入图片描述
    如图即为成功。不过需要注意的是:笔者在操作华为云实例的时候遇到一个问题是无法ping通外网,经过一番折腾后将安全组更改为Sys-default解决了这个问题
  6. 一般在生产环境下,不同模块都有不同的用户完成。为了贴合实际生产,我们新建一个hadoop用户。
    [root@node1 ~]$ useradd hadoop	# 新建一个用户hadoop
    [root@node1 ~]$ passwd hadoop	# 为hadoop用户创建密码
    
    创建好hadoop用户后,将该用户写入sudoers文件中。
    [root@node1 ~] vim /etc/sudoers
    
    在这里插入图片描述
    需要注意的是,保存时应该用wq!命令保存。
  7. 切换到hadoop用户,开始搭建hadoop环境
    [root@node1 ~] su hadoop
    

特别强调,以上步骤要在三台实例上的root用户下进行。创建hadoop用户后,可以将xshell连接中的配置进行更改,方便操作。

Hadoop完全分布式搭建

在这一部分我将不再赘述,只列出相应的步骤,网上已经有太多搭建的教程了。我的博客中也有。

  1. 登录hadoop用户,配置SSH免密登录。若没有ssh目录,可以先使用命令ssh node1自动创建。
  2. 安装JDK,这个很简单,解压后配置环境变量即可。不过需要注意的时,在使用华为云服务器的时候,我忽略了一个细节:华为云服务器的镜像是ARM的,因此应该使用ARM版的JDK。
    在这里插入图片描述在这里插入图片描述
    单击此处跳转各版本JDK下载地址
  3. 配置JDK环境变量,记得source配置文件。scp命令分发;
  4. 解压Hadoop,修改配置文件,配置环境变量,通过scp命令分发(这个过程非常的慢,因为带宽只有1M,我分发了一两个小时),初始化,启动HDFS和MapReduce。注意主机名不要写错。
  5. 为了能在本地访问NameNode Web页面,需要开放端口。你的NameNode配置在哪台云服务器上,就在该服务器上开放端口,这里以阿里云为例:在这里插入图片描述在这里插入图片描述
  6. 到此就可以通过公网IP:9870(看个人配置)的方式直接访问NN页面了。在这里插入图片描述
  7. 若想通过主机名的方式访问,需要修改本地的 “C:\Windows\System32\drivers\etc\hosts” 文件,将主机名和IP填入(全都是公网IP)
  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
使用三台服务器搭建一个完全分布式的Hadoop集群,你需要按照以下步骤进行操作: 1. 设置主机名和IP:在每台服务器上设置唯一的主机名和IP地址。 2. 配置主机的映射:在每台服务器上配置/etc/hosts文件,将每台服务器的主机名和IP地址进行映射。 3. SSH免密登录:在每台服务器上生成SSH密钥对,并将公钥复制到其他服务器上,以实现服务器之间的免密登录。 4. 关闭防火墙:在每台服务器上关闭防火墙,以确保Hadoop集群的正常通信。 5. 关闭SELinux:在每台服务器上禁用SELinux,以避免与Hadoop的正常运行产生冲突。 6. 安装JDK:在每台服务器上安装JDK,并设置JAVA_HOME环境变量。 7. 设置时间同步服务:在每台服务器上安装并配置NTP时间同步服务,以确保集群中所有服务器的时间同步。 8. 下载和安装Hadoop:在每台服务器上下载Hadoop的二进制文件,并解压到指定目录。你可以使用wget命令下载Hadoop的tar.gz文件,然后使用tar命令解压。 9. 配置Hadoop环境变量:在每台服务器上编辑hadoop-env.sh文件,设置Hadoop的环境变量,如JAVA_HOME、HADOOP_HOME等。 10. 配置Hadoop集群:在每台服务器上编辑core-site.xml、hdfs-site.xml和yarn-site.xml等配置文件,设置Hadoop集群的相关参数,如文件系统地址、副本数量、资源管理器地址等。 11. 启动Hadoop集群:在一台服务器上启动NameNode和ResourceManager,然后在其他服务器上启动DataNode和NodeManager。 请注意,以上步骤仅为概括,并不包含具体的配置细节。在实际操作中,你需要根据你的服务器环境和需求进行相应的配置。详细的操作步骤和配置参数可以参考Hadoop官方文档或其他教程资源。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [hadoop2.7.2分布式集群搭建(三台)](https://blog.csdn.net/PeiBoos/article/details/125914812)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [3台机器配置hadoop集群_Hadoop+Hbase 分布式集群架构](https://blog.csdn.net/wanghengwhwh/article/details/128567974)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值