首先第一篇文章介绍了如何配置hadoop基本环境,接下来进行伪分布式环境的搭建。
首先说一下hadoop集群的基本结构。
之后介绍一下它的三种模式:(下图英文缩写为上图中相应节点单词的缩写)
所谓伪分布模式就是:通过在一台机器上运行不同的java进程来模拟分布式模式的不同节点,这时,所读取得文件属于分布式文件。伪分布式中的计算机不仅负责存储,而且还负责资源和作业的调度。
单机模式与伪分布式模式最大的不同是,单机模式所读取的是本地文件,而伪分布式模式读取的文件属于分布式文件,因为没有很多个节点来搭建分布式模式,所以这里用的是伪分布模式。
<configuration>
<property>