Day2：初步了解Hive

最新推荐文章于 2024-07-25 11:27:49 发布

野宇酱酱

最新推荐文章于 2024-07-25 11:27:49 发布

阅读量747

点赞数 9

文章标签： hive hadoop

本文链接：https://blog.csdn.net/ye_yu181/article/details/138139388

版权

本文介绍了Hive作为Hadoop的数据仓库工具，其基于SQL查询的HQL语言、HDFS架构、优点（如学习成本低、可扩展性等）、缺点（如HQL表达力有限和效率低等），以及与之相关的shell命令和虚拟机使用注意事项。

摘要由CSDN通过智能技术生成

⚫ 概念

Hive是一个基于Hadoop的数据仓库工具；

可以将结构化的数据文件映射为一张数据库表；（相当于Schema）

提供SQL查询功能；

可以将SQL语句转换为MapReduce作业进行运行。

⚫HDFS架构

HDFS Client(客户端):是被设计成适合运行在通用硬件(commodity hardware)上的 Hadoop 的分布式文件系统。

NameNode(管理者):是管理文件系统命名空间的Master(主服务器)，用于管理客户端对文件的访问，执行文件系统命名空间操作，如打开，关闭和重命名文件和目录。

DataNode(Slave):通常是群集中每个节点一个，用于存储数据，负责提供来自文件系统客户端的读写请求。NameNode下达命令，DataNode执行实际的操作。如执行块创建，删除和复制。

Secondary NameNode(辅助):辅助后台程序，主要负责与 NameNode 进行通信，定期保存 HDFS 元数据的快照及备份其他 NameNode 中的内容，日常 Standby，当 NameNode 故障时顶替 NameNode 使用。

⚫Hive的优缺点

优点：

缺点：

⚫今日学习的shell命令

功能：显示文件和目录的信息

ls　以默认方式显示当前目录文件列表

ls -a 显示所有文件包括隐藏文件例如： .file 文件名称前面带小数点为隐藏文件。

ls -l 显示文件属性，包括大小，日期，符号连接，是否可读写及是否可执行

ls -lh 显示文件的大小，以容易理解的格式印出文件大小 (例如 1K 234M2G)*

ls -lt 显示文件，按照修改时间排序

功能：改名目录

cd dir　切换到当前目录下的dir目录

cd /　切换到根目录

cd ..　切换到到上一级目录

cd ../..　切换到上二级目录*

cd ~　切换到用户目录

cd - 返回上一步操作目录*

⚫有关虚拟机

能挂起尽量不使用“hutdown -h now (立即关机)”，能使用“hutdown -h now (立即关机)”,尽量不在外边直接关机。

关注