大数据笔记 Hadoop之HDFS

Hadoop核心——HDFS

在这里插入图片描述

HDFS的架构
HDFS是一个主/从(Master/Slave)体系结构。
HDFS由四部分组成:HDFS Client ,NameNode ,DataNode 和 Secondary NameNode。

1.Client:就是客户端

  • 文件切分、文件上传HDFS的时候,Client将文件切分成一个一个的Block,然后进行存储。
  • 与NameNode交互,获取文件的位置信息。
  • 与DataNode交互,读取或者写入数据。
  • Client提供一些命令来管理和访问HDFS,比如启动或者关闭HDFS。

2.NameNode: 就是master,他是一个主管,管理者

  • 管理HDFS的名称空间
  • 管理数据块(Block)映射信息
  • 配置副本策略
  • 处理客户端读写请求

3.DataNode: 就是Slave, NameNode下达命令,DataNode执行实际的操作。

  • 存储实际的数据块
  • 执行数据块的读/写操作

4.Secondary NameNode:并非NameNode的热备,当NameNode挂掉的时候,他并不能马上替换NameNode并提供服务

  • 辅助NameNode,分担其工作量
  • 定期合并fsimage和fsedits,并推送给NameNode
  • 在紧急情况下,可辅助恢复NameNode(NameNode挂掉的时候,Secondary NameNode就失去了存在的意义)

NameNode和DataNode作用

  • NameNode:

1.NameNode元数据信息:路径、时间、大小、权限、块列表在这里插入图片描述

2.NameNode文件操作:NameNode负责文件元数据的操作。DataNode负责处理文件内容的读写请求。数据流不经过NameNode,会询问他跟哪个DataNode联系 在这里插入图片描述

3.NmeNode副本:文件数据块到底存放到哪些DataNode上,是由NameNode决定的。NameNode根据全局情况做出放置副本的决定
4.NameNode心跳机制: 全权管理数据块的复制,周期性地接受心跳和块的状态报告信息(包含该DataNode上所有数据块的列表)。若接受心跳信息,NameNode认为DataNode工作正常。如果在十分钟后还接受不到DataNode的心跳,那么NameNode认为DataNode已经宕机。这时候NameNode准备要把DataNode上的数据块进行重新的复制。块的状态报告包含了一个DataNode上所有数据块的列表,biock report每隔一小时发送一次
在这里插入图片描述

  • DataNode:

提供真实文件数据的存储服务:
1.DataNode以数据块的形式存储HDFS文件
2.DataNode响应HDFS客户端读写请求
3.DataNode周期性向NameNode汇报心跳信息
4.DataNode周期性向NameNode汇报数据块信息
5.DataNode周期性向NameNode汇报缓存数据块信息

HDFS的文件副本机制与机架感知

文件副本机制:

副本配置查看命令:

[root@Slave1 hadoop]vim hdfs-site.xml

在这里插入图片描述

  • 所有文件都是以block块(默认大小为128M)的方式存放在HDFS文件系统当中,作用如下:
    1.一个文件有可能大于集群中任意一个磁盘,引入块机制,可以很好的解决这个问题
    2.使用块作为文件存储的逻辑单位,可以简化存储子系统
    3.块非常适合用于数据备份进而提供数据容错能力

机架感知:

  • HDFS系统内部的副本存放策略

第一个副本,在客户端所在机架中挑选一个节点(如果客户端是集群外的一台机器,就随机选节点,但是系统会避免挑选太满或者太忙的节点)
第二个副本,放在与第一个副本同机架但是不同节点上。
第三个副本,放在不同机架(随机选择)的节点上。
在这里插入图片描述

  • 副本1与副本2在同一机架里,可以保证当副本1宕机时,系统可以更加快速的读取到副本2的数据;副本3在其他机架里,以确保当副本1,2所在机架的机子全部宕机时,系统还可以读取到副本3的数据。

资料来源:https://www.bilibili.com/video/BV1154y1U73k?p=5

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像的目标属于哪个类别。 定位问题:确定目标在图像的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像的目标属于哪个类别。 定位问题:确定目标在图像的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值