一、Hadoop的部署模式
1、独立模式
在独立模式下,所有程序都在单个JVM上执行,调试Hadoop集群的MapReduce程序也非常方便。一般情况下,该模式常用于学习或开发阶段进行调试程序。
2、伪分布式模式
在伪分布式模式下, Hadoop程序的守护进程都运行在一台节点上,该模式主要用于调试Hadoop分布式程序的代码,以及程序执行是否正确。伪分布式模式是完全分布式模式的一个特例。
3、 完全分布式模式
在完全分布式模式下,Hadoop的守护进程分别运行在由多个主机搭建的集群上,不同节点担任不同的角色,在实际工作应用开发中,通常使用该模式构建企业级Hadoop系统。
二、集群规划
1、集群拓扑结构
一个主节点,两个从节点
2、角色分配
节点 角色
master NameNode, DataNode
slave1 DataNode
slave2 DataNode
三、jdk的安装和环境配置
1、下载路径
链接:https://www.oracle.com/webapps/redirect/signon?nexturl=https://download.oracle.com/otn/java/jdk/8u341-b10/424b9da4b48848379167015dcc250d8d/jdk-8u341-linux-i586.tar.gz
或者百度网盘提取:链接: https://pan.baidu.com/s/1o1EXc0xjtMiJ49Zw