@TOCHADOOP基础入门标题
1、hadoop安装文件夹##
路径:/usr/local/hadoop
版本: 2.6.4 版本
2、文件夹的内容
bin 一般存放可执行文件windows下扩展名一般为exe
linux(centos)下一般为.sh
sbin 文件夹存放的是sh文件,即hadoop的执行文件
start-all.sh 启动hadoop集群 stop-all.sh 关闭hadoop集群
conf 一般里面是软件的配置文件(hadoop无此文件夹)
etc/hadoop 里面放的是软件的配置文件,里面的xml文件即为配置文件
core-site.xml 核心配置文件
hdfs-site.xml 配置hdfs文件
mapred-site.xml 配置mapreduce文件
lib文件夹一般放的是jar文件
/usr/local/hadoop/hadoop-2.6.4/share/hadoop/hdfs
logs 存放log日志
3、进程
NameNode 为hadoop主进程(主节点)
SecondaryNameNode 第二个主进程(搭建集群时,一般namenode机器会有两台,一台为 namoenode 另一台为SecondaryNameNode)为 namenode备份
ResourceManager Resource资源 总体叫资源管理器 资源指内存、磁盘等
为集群分配资源 相当于资源调度器
以上三个进程一般存在master机器当中
下面两个进程一般出现在从节点当中,当前为什么出现在masters机器当中?
是因为在master机器当中的slaves配置文件当中配置了master
slaves是配置哪些机器是从节点的文件
NodeManager 节点管理器
DataNode 数据节点(从节点 )
从节点机器是存储数据
4、
namenode当中存储的是元数据(机器的IP地址、文件名称、文件路径、副本的数量等)