利用闲置电脑安装虚拟机搭建hadoop集群

前言

本人刚开始学习大数据,记录自己的一些学习笔记。大家在学习大数据开发的时候,第一件事情就是大数据环境的搭建,目前一般有三种搭建方式:1.使用windows环境搭建;2.自己电脑搭建linux虚拟机环境,可以自己建好多个虚拟机环境,然后搭建集群;3.购买云厂商的大数据集群或者主机自己搭建集群。第一种方式不主流,且出现问题解决资料不多,并且需要机子比较多。第二种方式自由度比较高,但是受限于自己机子的配置;第三种方式是目前的主流方式,但是要花钱。
由于电脑的升级换代,本人有一台老式12G内存、500G机械存储的某想笔记本,卡的不想做为办公电脑,还有一台8G内存、256G固态存储的新电脑(买来发现内存焊死了,不支持扩展,为什么配置这么尴尬,因为是白嫖的,便宜。。)。
想到在旧电脑上安装虚拟机,建几个linux环境,搭建hadoop集群;然后新电脑连接这个集群,还可以听老师讲课,敲代码。真是贫穷让人机智。
#博学谷IT学习技术支持#

一、虚拟机环境的准备

首先保证两台宿主机在一个网络环境下,假设他们为S1、S2,这边S1是我的新电脑、S2是我的旧电脑,它们的ip分别为:192.168.8.101、192.168.8.102。
在S2上安装虚拟机环境。使用虚拟机搭建hadoop集群的准备资料网上很多,一般就是下面几个步骤:

  1. 安装linux环境
  2. 安装jdk
  3. 安装hadoop,配置环境
  4. 安装hive,配置环境
    当前在VMware上建好了3个linux环境:node1、node2、node3,它们的ip分别为:192.168.9.101、192.168.9.102、192.168.9.103,并且安装了hadoop,hive集群,虚拟机网络配置为NAT,如下图:

在这里插入图片描述

一定要保证宿主机和虚拟机之间网络是互通的,一般不通要么是防火墙没关或者网络配置等问题。

二、连接虚拟机上的集群

1.整理需要连接的端口

远程端口:22
hdfs端口:9870
hive端口:10000
这几个端口是我在学习hadoop集群中要连接的。

2.配置VMware上虚拟机的端口转发

S2主机上安装了虚拟机环境(hadoop01、hadoop02、hadoop03),我们要用S1主机访问S2上的虚拟机环境,它们处于不同的子网,是不通的。当前S2和hadoop01-hadoop03是可以互相访问的,S1和S2连得同一个路由器是通的,要让S1能访问hadoop01-hadoop03,这时候查看资料发现VMware其实自带端口转发,把S2虚拟机上需要连接的端口都转发出来,这时候S1就可以通过访问这些转发端口从而访问虚拟机内部的端口了。整理如下:

虚拟机IP虚拟机端口主机IP主机转发端口
192.168.9.10122192.168.8.10110202
192.168.9.1029870192.168.8.10119870
192.168.9.10310000192.168.8.10110000

1.配置虚拟网络编辑器
在这里插入图片描述
2.更改NAT设置
在这里插入图片描述
3.选择NAT网络,点击NAT设置
在这里插入图片描述
4.添加映射端口
在这里插入图片描述
5.点击确定,按照1-4步骤依次将22、9870、10000端口都映射起来。

3.测试连接

打开S2上的node1-node3虚拟机,用S1远程S2上的node1,这时候连接IP是S2的IP,端口是映射端口10022,可以连接:
在这里插入图片描述
在这里插入图片描述
启动hadoop集群和hive集群,然后S1上就可以访问集群了,测试连接hdfs和hive都可以。
在这里插入图片描述

总结

本文使用VMware的端口转发功能,利用一台闲置电脑搭建虚拟机Hadoop集群,可以被相同子网中的其它主机连接,为后续学习大数据开发做准备。贫穷让我们相遇。
参考文章如下:
https://blog.csdn.net/qq_26230421/article/details/79232219

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
虚拟机搭建 Hadoop 集群可以通过使用虚拟化软件如 VMware 或 VirtualBox 来实现。以下是一个简单的步骤: 1. 首先,下载并安装虚拟化软件,如 VMware 或 VirtualBox。 2. 下载 Hadoop 的稳定版本,并解压缩到一个目录中。 3. 创建一个虚拟机,并为每个节点分配足够的资源(如 CPU、内存和存储)。 4. 安装操作系统,推荐使用 Linux 发行版,如 Ubuntu 或 CentOS。确保在每个节点上都安装了相同的操作系统版本。 5. 配置网络设置,确保虚拟机之间可以相互通信。可以选择使用 NAT、桥接模式或者创建一个内部网络。 6. 在每个节点上安装 Java 运行环境,Hadoop 是基于 Java 开发的。 7. 配置 Hadoop 环境变量,将 Hadoop 的 bin 目录添加到 PATH 环境变量中。 8. 编辑 Hadoop 的配置文件,主要包括 core-site.xml、hdfs-site.xml 和 mapred-site.xml。配置文件中需要指定各个节点的 IP 地址和端口号。 9. 启动 Hadoop 的各个组件,包括 NameNode、DataNode、ResourceManager、NodeManager 和 JobHistoryServer。 10. 在浏览器中访问 Hadoop 的管理界面,确认集群是否正常运行。 以上是一个简单的搭建 Hadoop 集群的步骤,实际操作中可能还需要进行一些额外的配置和调整。请注意,这只是一个基础的搭建过程,具体的步骤可能会因个人环境和需求而有所不同。如果遇到问题,可以参考 Hadoop 的官方文档或者在相关的社区寻求帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值