hadoop 学习笔记(hadoop架构)

本文是关于Hadoop学习的笔记,详细介绍了Hadoop的架构组件,包括client、switch、rack、namenode、secondnamenode、datanode、jobtracker和tasktracker的角色和功能。namenode作为核心控制器,负责文件系统的元数据管理和分布信息,而datanode则是实际存储数据的节点。jobtracker调度任务,tasktracker执行任务。架构中还提到了master和slave节点的部署策略。
摘要由CSDN通过智能技术生成

如下图所示:

client —用户

switch—交换机

rack—机架

namenode—名称节点,是hdfs(分布式文件系统)的守护程序,起到一个总控制的作用,记录文件是如何分割成数据块以及这些数据块是存在哪些节点上的。对内存和io进行集中管理,它是一个单点,所以一旦namenode崩溃,整个hadoop将崩溃。用户是先通过访问namenode,来明确文件所在的数据节点位置。(核心的功能)

secondlynamenode—辅助名称节点,是namenode的后备,namenode会与其进行通讯,将文件信息备份到secondlynamenode上,减少namenode的压力,但必须手动修补集群崩溃的问题,所以namenode还是单点形式的。

datanode—负责文件的具体读写,数据的存放。

jobtracker—处理用户提交的作业、将作业切割成若干个task(程序)分配到datanode(数据)里。重启失败的task,释放空间。与namenode相同,在一个集群里也只有一个。

tasktacker—任务跟踪器,与datanode结合(程序+数据),管理各自节点的tasktacker,每个节点只有一个tasktacker但可以执行多个jvm用于执行mapreduce任务。它会与jobtacker交互。

master—运行namenode、secondlynamenode、jobtacker的机器,一般会namenode、jobtacker一台机器,secondlynamenode一台机器。

slave—运行tasktacker、datanode。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值