超详细的Hadoop环境搭建（Ubuntu18.04.2）

最新推荐文章于 2024-10-09 11:36:28 发布

Andrew_Lii

最新推荐文章于 2024-10-09 11:36:28 发布

阅读量2.1k

点赞数 1

分类专栏：大数据文章标签： Hadoop

本文链接：https://blog.csdn.net/Andrew_Lii/article/details/96503937

版权

本文详述了在Ubuntu18.04.2上搭建Hadoop环境的过程，包括Linux环境安装（Vmware WorkStation设置、Ubuntu安装、SSH配置、Hostname修改和JDK安装），Hadoop本地模式安装，以及Hadoop伪分布式配置的详细步骤。通过这些步骤，读者可以成功配置一个运行在Linux上的Hadoop伪分布式系统。

摘要由CSDN通过智能技术生成

本文共分为三个部分

第一部分：Linux环境安装

Hadoop运行在Linux环境中，虽然借助工具也可以部署在Windows上，但是还是建议在Linux环境中进行部署，第一部分将简单介绍Linux环境的安装、配置、JDK安装
第二部分：Hadoop本地模式安装

Hadoop本地模式只能用于本地的开发和调试，如果想要快速体验一下Hadoop，本地模式是我们的不二选择
第三部分：Hadoop伪分布式模式配置

Hadoop的学习一般都在伪分布式模式下进行，之所以叫伪分布式模式是因为虽然各个模块势在各个进程中分开运行的，但是只是运行在一个操作系统中，并不是真正的分布式，我们将着重介绍这部分，并尝试敲一个简单的项目
第四部分：结语和一个小项目

一个简单的小项目，见下一篇博客

Linux环境安装

一、安装Vmware WorkStation和下载Ubuntu安装包

Vmware WorkStation的安装和一般软件的安装没有差别，一路next就可以了。同时下载好Ubuntu的安装包备用

二、虚拟网络编辑器的设置（NAT模式设置）

NAT意为网络地址转换，是在主机和虚拟机之间架设一个地址转换服务，负责外部和虚拟机之间的网络通讯转接和IP映射，我们部署Hadoop集群要求各个虚拟机有固定的IP，可以访问外网，需要进行以下配置

默认NAT设置
取消DHCP服务
默认的NAT设置是启用DHCP服务的，NAT服务会自动将IP地址分配给虚拟机，但是我们需要将各个虚拟机的IP固定下来所以取消掉这个默认设置
为机器设置一个子网网段
机器默认是192.168.136网段，我们在这里修改为192.168.79网段，将来各个虚拟机的IP就为192.168.79.***
为机器设置DNS地址

三、在Vmware WorkStation中安装Ubuntu

文件菜单选择新建虚拟机
选择经典类型安装
选择稍后安装操作系统
选择Linux系统，选择版本Ubuntu64位
命名虚拟机，并选择Linux系统保存在主机的哪个目录下，一个虚拟机应该独立拥有一个目录，切记不要让多个虚拟机使用同一个目录
指定磁盘容量，设置分配给此虚拟机的硬盘空间的大小，默认20GB，不变
点击完成之后，我们就已经完成了虚拟机的创建了，但是此时的虚拟机还没有操作系统，还记得我们之前下载的Ubuntu的安装包吗，到了它发挥作用的时候了
点击编辑虚拟机设置，点击DVD，指定操作系统ISO文件的位置，也就是Ubuntu安装包的位置
点击启动虚拟机，开始安装Ubuntu
Ubuntu的安装步骤这里就不详细展开了，网上有许多相关的教程和解答，我们直接跳到Ubuntu的网络设置
点击有线设置
点击有线网络开关右侧的齿轮图标
配置IP、子网掩码、网关和DNS，因为在之前的NAT设置中我们将网段设置为192.168.79.***，所以这里我们将IP设置为192.168.79.10，其余三项设置与NAT设置保持一致
使用 ping 命令检查是否可以连接外网，如下图，连接成功