hadoop
分布式系统基础架构,用来进行海量数据的储存和分析计算,广义泛指hadoop生态圈。
优点:高容错性,高效性,高扩展性,高可靠性。
HDFS 架构概述:简称HDFS,是一个分布式文件系统;
NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。
(2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。
(3)Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份。
![](https://i-blog.csdnimg.cn/blog_migrate/8626b962ea9df1ff085e5370c82a4d92.png)
Hadoop 运行环境搭建
模板虚拟机环境准备
克隆虚拟机
在 hadoop102 安装 JDK
在 hadoop102 安装 Hadoop
Hadoop 目录结构