（第3篇）HDFS是什么？HDFS适合做什么？我们应该怎样操作HDFS系统？

最新推荐文章于 2024-07-01 12:58:04 发布

ijia1

最新推荐文章于 2024-07-01 12:58:04 发布

阅读量3.2k

点赞数 2

文章标签： hadoop 大数据 hdfs mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ijia1/article/details/62040634

版权

本文详细介绍了HDFS（Hadoop分布式文件系统）的特点，如适合存储超大文件、一次写入多次读取等，并指出其不适合低延迟、大量小文件和多用户更新等场景。此外，文章还探讨了HDFS的体系结构、数据块复制策略、读写流程，以及如何操作HDFS的基本命令。

摘要由CSDN通过智能技术生成

点击链接 http://blog.csdn.net/ijia1 访问我的博客，学习更多Hadoop知识。

HDFS文件系统

Hadoop 附带了一个名为 HDFS(Hadoop分布式文件系统)的分布式文件系统，专门存储超大数据文件，为整个Hadoop生态圈提供了基础的存储服务。

本章内容：

1) HDFS文件系统的特点，以及不适用的场景

2) HDFS文件系统重点知识点：体系架构和数据读写流程

3) 关于操作HDFS文件系统的一些基本用户命令

1. HDFS特点：

HDFS专为解决大数据存储问题而产生的，其具备了以下特点：

1) HDFS文件系统可存储超大文件

每个磁盘都有默认的数据块大小，这是磁盘在对数据进行读和写时要求的最小单位，文件系统是要构建于磁盘上的，文件系统的也有块的逻辑概念，通常是磁盘块的整数倍，通常文件系统为几千个字节，而磁盘块一般为512个字节。

HDFS是一种文件系统，自身也有块（block）的概念，其文件块要比普通单一磁盘上文件系统大的多，默认是64MB。

HDFS上的块之所以设计的如此之大，其目的是为了最小化寻址开销。

HDFS文件的大小可以大于网络中任意一个磁盘的容量，文件的所有块并不需要存储在一个磁盘上，因此可以利用集群上任意一个磁盘进行存储，由于具备这种分布式存储的逻辑，所以可以存储超大的文件，通常G、T、P级别。

2) 一次写入，多次读取

一个文件经过创建、写入和关闭之后就不需要改变，这个假设简化了数据一致性的问题，同时提高数据访问的吞吐量。

3) 运行在普通廉价的机器上

Hadoop的设计对硬件要求低，无需昂贵的高可用性机器上，因为在HDFS设计中充分考虑到了数据的可靠性、安全性和高可用性。

2. 不适用于HDFS的场景：

1) 低延迟

HDFS不适用于实时查询这种对延迟要求高的场景，例如：股票实盘。往往应对低延迟数据访问场景需要通过数据库访问索引的方案来解决，Hadoop生态圈中的Hbase具有这种随机读、低延迟等特点。

2) 大量小文件

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ijia1 CSDN认证博客专家 CSDN认证企业博客

码龄8年

8: 原创

31万+: 周排名

156万+: 总排名

7702: 访问

: 等级

167: 积分

13: 粉丝

3: 获赞

6: 评论

11: 收藏

私信

关注

热门文章

分类专栏

课程免费分享
大数据课程 1篇

最新评论

（第6.1篇）大数据发展背后的强力推手——HBase分布式存储系统
ijia1: 【如何用4个月学会Hadoop开发并找到年薪25万工作？】免费分享一套17年最新Hadoop大数据教程和100道Hadoop大数据必会面试题。因为链接经常被和谐，需要的朋友请加微信ganshiyun666 来获取最新下载链接，注明“CSDN” 教程已帮助300+人成功转型Hadoop开发，90%起薪超过20K，工资比之前翻了一倍。由百度Hadoop核心架构师（T7级别）亲自录制。内容包括0基础入门、Hadoop生态系统、真实商业项目实战3大部分。其中商业案例可以让你接触真实的生产环境，训练自己的开发能力。
（第5篇）避免协作冲突--简单易接入的Zookeeper
ijia1: 【如何用4个月学会Hadoop开发并找到年薪25万工作？】免费分享一套17年最新Hadoop大数据教程和100道Hadoop大数据必会面试题。因为链接经常被和谐，需要的朋友请加微信ganshiyun666 来获取最新下载链接，注明“CSDN” 教程已帮助300+人成功转型Hadoop开发，90%起薪超过20K，工资比之前翻了一倍。由百度Hadoop核心架构师（T7级别）亲自录制。内容包括0基础入门、Hadoop生态系统、真实商业项目实战3大部分。其中商业案例可以让你接触真实的生产环境，训练自己的开发能力。
（第4篇）hadoop之魂--mapreduce计算框架，让收集的数据产生价值
ijia1: 【如何用4个月学会Hadoop开发并找到年薪25万工作？】免费分享一套17年最新Hadoop大数据教程和100道Hadoop大数据必会面试题。因为链接经常被和谐，需要的朋友请加微信ganshiyun666 来获取最新下载链接，注明“CSDN” 教程已帮助300+人成功转型Hadoop开发，90%起薪超过20K，工资比之前翻了一倍。由百度Hadoop核心架构师（T7级别）亲自录制。内容包括0基础入门、Hadoop生态系统、真实商业项目实战3大部分。其中商业案例可以让你接触真实的生产环境，训练自己的开发能力。
（第3篇）HDFS是什么？HDFS适合做什么？我们应该怎样操作HDFS系统？
ijia1: 【如何用4个月学会Hadoop开发并找到年薪25万工作？】免费分享一套17年最新Hadoop大数据教程和100道Hadoop大数据必会面试题。因为链接经常被和谐，需要的朋友请加微信ganshiyun666 来获取最新下载链接，注明“CSDN” 教程已帮助300+人成功转型Hadoop开发，90%起薪超过20K，工资比之前翻了一倍。由百度Hadoop核心架构师（T7级别）亲自录制。内容包括0基础入门、Hadoop生态系统、真实商业项目实战3大部分。其中商业案例可以让你接触真实的生产环境，训练自己的开发能力。
（第2篇）一篇文章教你轻松安装hadoop
ijia1: 【如何用4个月学会Hadoop开发并找到年薪25万工作？】免费分享一套17年最新Hadoop大数据教程和100道Hadoop大数据必会面试题。因为链接经常被和谐，需要的朋友请加微信ganshiyun666 来获取最新下载链接，注明“CSDN” 教程已帮助300+人成功转型Hadoop开发，90%起薪超过20K，工资比之前翻了一倍。由百度Hadoop核心架构师（T7级别）亲自录制。内容包括0基础入门、Hadoop生态系统、真实商业项目实战3大部分。其中商业案例可以让你接触真实的生产环境，训练自己的开发能力。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。