HDFS简单介绍汇总

1,hadoop是什么
Hadoop:一个分布式系统的基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力告诉运算和存储
Distributed:分布式计算是利用互联网上的计算机cpu的共同处理能力来解决大型计算的问题的一种计算科学
file system:文件系统是操作系统用于明确磁盘或分区上的文件的方法和数据结构,即在磁盘上组织文件的方法

2,hadoop与hdfs的关系
hadoop实现了一个分布式文件系统简称hdfs,对外部客户机而言,hdfs就像一个传统的分级文件系统,可以创建删除移动或者重命名文件。

3,什么是文件系统
操作系统中负责管理和存储文件信息的软件机构称为文件管理系统,只要有文件管理,就得又文件系统。
文件系统有三部分组成 文件管理软件 被管理软件 文件存储结构

4,文件系统是对文件存储器空间进行组着和分配,负责文件存储并对存入的文件进行保护和检索的系统

5,为什么需要hdfs
a,因为读取一块磁盘的所有数据需要很长时间,写入需要更长的时间(写入一般是读取的三倍),
  一块磁盘的传输能力有限,多块磁盘可以同时传输
b,当数据集的大小超过一台独立的物理计算机的能力时,就有必要对其进行分区并存储在若干台单独的计算机上
c,分布化的文件系统为因为分布后的机构不完整,导致系统复杂度加大,并且引入网络编程,同样导致分布式文件系统更加复杂

对于上面的问题,hdfs迎刃而解。hdfs以流处理访问模式来存储文件,一次写入,多次读取,数据源通常有源生成或者从数据源直接复制而来,接着长时间在此数据集上进行各类分析,大数数据不需要搬来搬去

完整性文件----》经dfs存储后---》分片文件

HDFS解决海量校验的方法:分片冗余,本地校验

完整性校验----分片后--》每个分片文件需要分片服务器校验

只要冗余文件的分片文件有一片是完整的,经过多次协调,其它分片文件也将完整


分片后存在的问题:因为文件不在一个磁盘导致读取访问操作延时

6,hdfs中block默认64m

7,hdfs提供mapreduce数据服务

8,分布式文件抽象优势
a,一个文件可大于每个硬盘
b,文件不用全在一个磁盘上
c,简化了存储子系统设计

9,配置hdfs集群的成本主要是内存和硬盘 master内存 slaver硬盘

 


http://wenku.baidu.com/view/7d9021bcf121dd36a32d82bd.html
http://wenku.baidu.com/view/c1a3df4033687e21af45a9f6.html###

http://wenku.baidu.com/view/7d9021bcf121dd36a32d82bd.html###

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HDFS的Web页面提供了一种方便的方式来管理和监控Hadoop分布式文件系统。通过在浏览器中输入http://node01:50070(其中node01是NameNode所在的节点或IP地址),您可以登录HDFSWeb浏览器。 在登录后,您可以使用不同的选项来查看和管理HDFS的各个方面。其中一些选项包括: 1. datanodes:显示所有datanode节点的信息,这对于了解数据节点的状态和健康程度非常有用。 2. Datanode Volume Failures:显示失败的数据节点卷的信息,这对于排查和解决数据节点故障非常有帮助。 3. snapshot:显示HDFS文件系统的快照信息,这对于查看和管理文件系统的历史状态非常重要。 4. startupprogress:显示HDFS启动过程的详细信息,这对于监控和调试HDFS的启动过程非常有帮助。 5. Utilities Browse the file system:显示HDFS文件目录结构以及文件的详细信息,这对于浏览和查找特定文件非常有用。 此外,Web页面还提供了关于NameNode的存储路径的信息。NameNode存储数据的路径为/export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/nn/edits,而存储fsimage的路径为/export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/namenodeDatas。这些路径对于了解和管理NameNode存储的数据非常重要。 总之,HDFS的Web页面提供了一个方便的界面来管理和监控Hadoop分布式文件系统,您可以通过该页面查看节点信息、故障信息、快照信息,并浏览和管理文件系统的内容。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [HDFS-web界面介绍](https://blog.csdn.net/qq_45769990/article/details/109146764)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [hadoop之hdfs与yarn界面功能介绍](https://blog.csdn.net/qq_32641659/article/details/87912452)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值