Hadoop

最新推荐文章于 2024-07-28 16:45:11 发布

子春十六..

最新推荐文章于 2024-07-28 16:45:11 发布

阅读量172

点赞数 4

文章标签： hadoop 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_79855823/article/details/136493164

版权

本文介绍了大数据的四个关键特征，区分了结构化和非结构化数据，并详细探讨了Hadoop生态系统，特别是HDFS架构及文件读取流程。

摘要由CSDN通过智能技术生成

1.大数据的特征：

数据量大（Volume)，各种类型多样（Variety)，价值密度低（Value)，高速（Velocity)

2.结构化数据：

可以从名称中看出，是高度组织和整齐格式化的数据。结构化数据也被成为定量数据，是能够用数据或统一的结构加以表示的信息，如数字、符号。但结构化数据的扩展性不好。

非结构化数据：非结构化数据本质上是结构化数据之外的一切数据。简单的说，非结构化数据就是字段可变的的数据。对非结构化数据，一般以二进制的形式直接整体进行存储。例：文本文件，电子邮件，微信，office文档。

3.Hadoop生态圈：

Hadoop是目前应用最为广泛的分布式大数据处理框架，其具备可靠、高效、可伸缩等特点。

Hadoop的核心组件是HDFS，MapReduce。

4.Hadoop hdfs架构：

HDFS架构：主从架构。NameNode是主节，DataNode是从节点。

5.hdfs读的流程：

1.HDFS客户端远程调用Namenode，查询元数据信息，获得这个文件的数据块位置列表，返回封装DFSIntputStream的HdfsDataInputStream输入流对象。

2.客户端选择一台可用Datanode服务器，请求建立输入流。

3.Datanode向输入流中写原始数据和以packet为单位的checksum。

4.客户端接收数据。如遇到异常，跳转至步骤2，直到数据全部读出，而后客户端关闭输入流。

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Hadoop

查询元数据信息，获得这个文件的数据块位置列表，返回封装DFSIntputStream的HdfsDataInputStream输入流对象。：非结构化数据本质上是结构化数据之外的一切数据。简单的说，非结构化数据就是字段可变的的数据。4.客户端接收数据。如遇到异常，跳转至步骤2，直到数据全部读出，而后客户端关闭输入流。数据，是能够用数据或统一的结构加以表示的信息，如数字、符号。例：文本文件，电子邮件，微信，office文档。HDFS架构：主从架构。服务器，请求建立输入流。可以从名称中看出，是。
复制链接

扫一扫

子春十六.. CSDN认证博客专家 CSDN认证企业博客

码龄1年

5: 原创

137万+: 周排名

15万+: 总排名

2877: 访问

: 等级

108: 积分

49: 粉丝

56: 获赞

2: 评论

48: 收藏

私信

关注

热门文章

最新评论

Hive组件安装配置
CSDN-Ada助手: 恭喜你在博客上发布了第四篇关于"Hive组件安装配置"的文章！持续分享知识对读者们是非常有益的。希望你能继续保持创作的热情，不断探索更多有趣的主题，让更多的人受益。或许下一步可以考虑分享一些实际应用场景下的案例分析或者最佳实践，让读者们更好地理解和应用所学知识。期待你的下一篇文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
快速配置虚拟机ip及yum仓库
全栈小5: 优质好文，博主用心，写了这么实用有效的分享，期盼博主光顾我的博客，给予宝贵指导！互相进步！支持【快速配置虚拟机ip及yum仓库，博主这篇文章，值得一看】
快速配置虚拟机ip及yum仓库
CSDN-Ada助手: 恭喜用户在博客领域又发布了一篇有用的内容！快速配置虚拟机ip及yum仓库这个主题确实很实用，对于很多人来说都是非常有帮助的。希望用户能够继续坚持下去，继续分享更多有关技术方面的知识和经验。或许在下一篇博客中，可以深入探讨一些高级的配置技巧或者是一些实用的工具的使用方法，让读者受益更多。期待用户的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。