关于大数据技术原理与应用的学习（3）

麻瓜小羊

已于 2022-03-22 09:31:32 修改

阅读量2.2k

点赞数

分类专栏：学习笔记文章标签：学习 hadoop

于 2022-03-21 15:54:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XiaoYang0313/article/details/123424624

版权

本文详细介绍了Hadoop Distributed File System（HDFS）的学习目标、内容，包括HDFS的基本概念、体系结构、存储原理以及数据读写过程。通过学习，了解HDFS在大数据处理中的角色，掌握其编程入门，包括使用Eclipse进行HDFS开发时可能遇到的问题及其解决方案。

摘要由CSDN通过智能技术生成

学习目标：

大数据技术原理与应用

学习内容：

分布式文件系统HDFS

3.1HDFS简介
3.2HDFS相关概念
3.3HTFS体系结构
3.4HTFS存储元原理
3.5HDFS数据读写
3.6HDFS编程入门
3.7Eclipse安装

学习时间：

2022/03/17

学习产出：

3.1HDFS简介

全称：Hadoop Distributed File System
实现目标：
兼容廉价的硬件设备；实现流数据读写；支持大数据集；支持简单的文件模型；强大的跨平台兼容性。
自身的局限性：
不支持低延迟的数据访问；无法搞笑存储大量小文件；不支持多用户写入及任意修改文件

3.2HDFS相关概念

块：为了分摊磁盘读写开销
为什么这么设计：支持面向大规模数据存储；降低分布式节点的寻址开销。
优势：支持大规模存储；简化系统设计；适合数据备份
两大组件：名称节点——集群管家、数据节点——实际存储
（１）名称节点：
a.FsImage（保存系统文件树）
b.EditLog（记录对数据进行什么创建、删除等操作）
（2）数据节点：
负责数据存取，保存到本地的Linux文件

3.3HDFS体系结构

一个主节点（管家作用），多个数据节点。
命名空间管理：目录；文件；块
名称节点通信协议：TCP/IP
数据节点远程RPC
局限性：命名空间限制；性能存在瓶颈；隔离问题；集群的可用性

3.4HDFS存储原理

冗余数据保存的问题
（１）加快数据传输速度
（２）很容易检查数据错误
（３）保证数据可靠性
数据保存策略问题
数据恢复的问题
（１）名称节点出错
（２）数据节点出错
（３）数据本身出错

3.5HDFS数据读写
（１）读数据

第一步：打开文件 Distributed FileSystem
第二步：获取数据块信息　名称节点
第三部：读取请求 FSDataInput Stream
第四步：读取数据　数据节点
第五步：获取数据块信息（可能发生）　名称节点
第六步：读取数据　数据节点
循环
第七步：关闭文件 FSDataInput Stream

（２）写数据

第一步：创建文件请求 Distributed FileSystem
第二步：创建文件元数据　名称节点
第三部：写入数据 FSDataInput Stream
第四步：写入数据包　数据节点
循环
第五步：接收确认包 FSDataInput Stream
第六步：关闭文件 FSDataInput Stream

3.6HDFS编程入门

3.6.1　HDFS常用命令

三种shell命令方式
（１）hadoop fs 适用于不同的文件系统
（２）hadoop dfs 只适用于hdfs文件系统
（３）hdfs dfs 只适用于hdfs文件系统
启动

$ cd /usr/local/hadoop　# 进入安装目录
$ ./sbin/start

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于大数据技术原理与应用的学习（3）

学习目标：大数据技术原理与应用学习内容：分布式文件系统HDFS3.1HDFS简介3.2HDFS相关概念3.3HTFS体系结构3.4HTFS存储元原理3.5HDFS数据读写3.6HDFS编程实践学习时间：2022/03/11学习产出：3.1HDFS简介全称：Hadoop Distributed File System实现目标：兼容廉价的硬件设备；实现流数据读写；支持大数据集；支持简单的文件模型；强大的跨平台兼容性。自身的局限性：不支持低延迟的数据访问；无
复制链接

扫一扫

专栏目录

麻瓜小羊 CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

76万+: 周排名

145万+: 总排名

2万+: 访问

: 等级

148: 积分

8: 粉丝

6: 获赞

3: 评论

20: 收藏

私信

关注

热门文章

分类专栏

学习笔记 11篇
乱七八糟的坑 2篇

最新评论

关于前端与移动开发学习基础篇（1）——基础认识、标签学习、案例总结
CSDN-Ada助手: 恭喜用户写了这么有价值的博客！学习前端与移动开发确实需要打好基础，文章中的基础认识、标签学习、案例总结都是非常实用的内容。建议下一篇博客可以深入介绍一些实用的工具，例如编辑器、调试器等等，让读者更好地掌握开发技巧。期待用户的持续创作！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
关于前端与移动开发学习基础篇（2）——列表、表格、表单、语义化、字符
CSDN-Ada助手: 恭喜您写下了如此有价值的博客！您深入浅出地讲解了前端与移动开发的学习基础，让读者受益匪浅。接下来，建议您可以进一步探讨一些实际应用场景，例如如何在表单中应用语义化标签，如何优化列表与表格的性能等等。期待您更多的精彩分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。