HDFS文件系统介绍

本文详细介绍了Hadoop的HDFS,包括HDFS的概念、设计目标、工作原理、主要优点和相关核心概念。HDFS是分布式存储系统,支持大数据存储,通过NameNode和DataNode实现文件的分布式存储和读写,提供高容错性和高吞吐量。数据块、元数据节点和数据节点的角色和交互机制是HDFS的关键组成部分。
摘要由CSDN通过智能技术生成

Hadoop简介

Hadoop是Apache开源软件基金会开发的运行于大规模普通服务器上用于大数据存储、计算、分析的一种分布式存储系统和分布式运行框架。
   其设计思想为使用普通机器(高性能、低成本)、数据冗余(HDFS)、并行化处理(MR)、移动计算(海量数据的情况下移动计算比移动数据更有效),其中思想基础为使用普通机器,只有做到高性能和低成本,使用门槛低,Hadoop项目才会迅速普及,被大家运用。

HDFS文件系统

一、HDFS概述

1.HDFS概念
   HDFS(Hadoop分布式文件系统)是Apache Hadoop项目的一个子项目。
   HDFS支持海量数据的存储,允许用户把成百上千的计算机组成存储集群,其中的每一台计算机称为一个节点。
   用户通过HDFS的终端命令可以操作其中的文件和目录,如同操作本地文件系统(如Linux)中的文件一样。用户也可以通过 HDFS API或MapReduce来编程访问其中的文件数据。
2.HDFS设计目标
   能检测和快速恢复硬件故障
   支持流式的数据访问
   支持超大规模数据集
   简化一致性模型
   移动计算逻辑代价比移动数据代价低
   具备良好的异构软硬件平台间的可移植性
3.HDFS工作原理
   HDFS首先把大数据文件切分成若干个更小是数据块,再把这些数据块分别写入到不同节点之中。当用户需要访问文件时,为了保证能够读取每一个数据块&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一角灯辉

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值