Hadoop学习day2

最新推荐文章于 2024-07-15 19:00:06 发布

Tion_W

最新推荐文章于 2024-07-15 19:00:06 发布

阅读量148

点赞数 4

文章标签： hadoop 学习大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Tion_W/article/details/138130157

版权

本文介绍了ApacheHive，一款支持类SQL语法的分布式SQL计算工具，它利用MapReduce处理海量数据。同时概述了HDFS的文件块设计和容错机制，以及Hadoop提供的HDFSshell命令用于文件系统操作。

摘要由CSDN通过智能技术生成

Hive

Apache Hive是一款分布式SQL计算的工具，其主要功能是：

将SQL语句翻译成MapReduce程序运行。

使用Hive处理数据的好处

操作接口采用类SQL语法，提供快速开发的能力。
底层执行MapReduce，可以完成分布式海量数据的SQL处理。

Hive架构图

HDFS的副本机制

HDFS被设计成能够在一个大集群中跨机器可靠地存储超大文件。它将每个文件存储成一系列的数据块，这个数据块被称为block，除了最后一个，所有的数据块都是同样大小的。
在Hadoop中，为了容错，文件里的数据块都有备份。以便当一个数据块无法使用，能从其他的数据块中调用。
hadoop 当中, 文件的 block 块大小默认是 128M

HDFS的Shell命令

安装好 hadoop 环境之后，可以执行 hdfs 相关的 shell 命令对 hdfs 文件系统进行操作，比如文件的创建、删除、修改文件权限等。
对 HDFS 的操作命令类似于 Linux 的 shell 对文件的操作，如 ls 、 mkdir 、 rm 等。

Hadoop提供了文件系统的 shell 命令使用格式如下：

hadoop fs 命令（官方用法）或 hdfs dfs 命令

（在集群中对文件进行的命令格式）

关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
Hadoop学习day2

使用Hive处理数据的好处。
复制链接

扫一扫

Tion_W CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

183万+: 周排名

17万+: 总排名

1072: 访问

: 等级

67: 积分

15: 粉丝

21: 获赞

6: 评论

16: 收藏

私信

关注

热门文章

最新评论

Hadoop学习day2
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
项目实战day4
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
今日Hadoop学习成果day1
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hadoop学习day2
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
项目实战day4
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。