大数据实践学习第二天

YueYe6

已于 2024-04-23 21:45:32 修改

阅读量956

点赞数 22

文章标签：学习

于 2024-04-23 21:35:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YueYe6/article/details/138116507

版权

本文介绍了Hadoop集群的基础配置，如HDFS的常用Shell命令，包括ls、mkdir、mv、rm、cp和cat等。此外，还详细讲解了ApacheHive的分布式SQL计算和元数据管理，以及如何通过实践如创建虚拟机集群和连接MySQL来运用这些技术。

摘要由CSDN通过智能技术生成

目录

一、Hadoop集群学习

二、HDFS的Shell命令

三、Apache Hive

分布式SQL计算

一、Hadoop集群学习

• 一键启动大数据环境 /onekey/my-start-all.sh

• 一键关闭大数据环境 /onekey/my-stop-all.sh

⚫ HDFS被设计成能够在一个大集群中跨机器可靠地存储超大文件。它将每个文件存储成一系列的数据块，这个数据块被称为block，除了最后一个，所有的数据块都是同样大小的。

⚫ 为了容错，文件的所有block都会有副本。每个文件的数据块大小和副本系数都是可配置的。

⚫ hadoop 当中, 文件的 block 块大小默认是 128M（134217728字节）。

二、HDFS的Shell命令

Hadoop提供了文件系统的shell命令使用格式如下：hadoop fs 或者 hdfs dfs

ls命令

-ls

格式： hadoop fs -ls URI

作用：类似于Linux的ls命令，显示文件列表

hadoop fs -ls / #显示文件列表

hadoop fs –ls -R / #递归显示文件列表

mkdir命令

格式：hadoop fs –mkdir [-p] <paths>

作用: 以中的URI作为参数，创建目录。使用-p参数可以递归创建目录

mv命令

格式： hadoop fs -mv

作用：将hdfs上的文件从原路径src移动到目标路径dst,该命令不能夸文件系统

rm命令

应用:

hadoop fs -rm /initial-setup-ks.cfg #删除文件

hadoop fs-rm -r /dir2 #删除目录

作用：删除参数指定的文件和目录，参数可以有多个，删除目录需要加-r参数

cp命令

格式: hadoop fs -cp

作用：将文件拷贝到目标路径中

cat命令

格式: hadoop fs -cat

作用：将参数所指示的文件内容输出到控制台

put命令

应用：

hadoop fs -put /root/1.txt /dir1 #上传文件

hadoop fs –put /root/dir2 / #上传目录

作用：将单个的源文件或者多个源文件srcs从本地文件系统上传到目标文件系统中。

get命令

格式: hadoop fs -get

作用：将HDFS文件拷贝到本地文件系统。

三、Apache Hive

分布式SQL计算

Apache Hive将SQL语句翻译成MapReduce程序运行

Apache Hive将文件转换为表结构

元数据（Metastore）：记录存储数据的数据。

练习

1、创建虚拟机并配置集群

2.Apache Hive和MySQL连接客户端

总结

通过对Hadoop集群和Apache Hive的学习，知道了Apache Hive、MySQL和Hadoop之间的联系，也学会了如何使用Shell命令来对数据进行操作，明确了大数据行业知识的广泛性，在以后的学习中还需要更加努力的学习，提升自己的能力。

关注

22
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

YueYe6 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

139万+: 周排名

17万+: 总排名

2666: 访问

: 等级

123: 积分

36: 粉丝

78: 获赞

3: 评论

57: 收藏

私信

关注

热门文章

最新评论

大数据实践学习第二天
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hadoop入门知识
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大数据实践学习第二天
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大数据实践学习第四天
CSDN-Ada助手: 恭喜你学习第四天，已经写了第四篇博客！坚持不懈的学习态度令人钦佩。接下来，建议可以继续深入学习大数据实践，可以多尝试一些实际案例分析或者数据处理技巧的分享，相信会对读者有更大的帮助。加油，期待你更多的精彩内容！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。