关于Hive架构原理，尚硅谷

最新推荐文章于 2024-07-16 13:43:40 发布

大数据ＳＱＬｂｏｙ

最新推荐文章于 2024-07-16 13:43:40 发布

阅读量835

点赞数 13

分类专栏： # Hive 文章标签： hive 架构 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_70437378/article/details/135729174

版权

Hive 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

最近学习hive 时候，在做一个实操案例，具体大概是这样子的：

我在dataGip里建了一个表，然后在hadoop集群创建一个文本文件里面存储了数据库表的数据信息，然后把他上传到hdfs后，dataGrip那个表也同步了我上传到hdfs数据信息，这一下子让我有点懵了，为什么可以实现同步呢？

首先hive的定义为，基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，Hive中每张表的数据存储在HDFS

·用户接口：Client , 其中包括CLI（command-line interface）、JDBC/ODBC。

·元数据：Metastore，包括：数据库（默认是default）、表名、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录等。

·hiveserver2是hive中的服务，其作用是提供jdbc/odbc接口，为用户提供远程访问Hive数据的功能，例如用户期望在个人电脑中访问远程服务中的Hive数据，就需要用到Hiveserver2。

另外对于hiveserver2访问

·可以使用命令行客户端beeline进行远程访问

·或者使用Datagrip等图形化客户端(类似于navicat)进行远程访问

这里关键在于理解真正的表数据信息在hdfs,而在dataGrip的表实际上是根据matestored 元数据以及hdfs数据信息映射到数据库得到的一张张表。

而且datagrip实际上根据hdfs路径找到对应的数据信息的

因此回到我上面讲的实操案例，具体流程：

我在首先创建一个表(注意：建表是有默认hdfs路径)，比如teacher，这个表的元数据信息(如表名、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录等、hdfs对应路径信息存储在mesatore，即MySQL
我从集群上传表的数据，然后此时hdfs上我所上传指定的位置路径（也是建表时的指定hdfs路径（我现在使用默认的））
之后，dataGrip通过hdfs路径上获得了表的数据，并利用映射关系将数据与元数据结构化得到对应的表及数据，从而实现所谓的“同步”。

大数据ＳＱＬｂｏｙ

关注

13
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
关于Hive架构原理，尚硅谷

结构化的数据文件映射为一张表。
复制链接

扫一扫

专栏目录

大数据ＳＱＬｂｏｙ CSDN认证博客专家 CSDN认证企业博客

码龄2年

122: 原创

105万+: 周排名

2万+: 总排名

5万+: 访问

: 等级

2015: 积分

524: 粉丝

779: 获赞

87: 评论

671: 收藏

私信

关注

热门文章

分类专栏

最新评论

二叉树的最近公共祖先，力扣
大数据ＳＱＬｂｏｙ: 二刷记录：首先所谓最近公共祖先，指的是当root 为p、q两个节点的公共祖先，但是，root的子节点不是p、q公共节点，那root此时就是p、q的最近公共子节点其次，根据题意可以分为三种情况，p、q在root 子树中,或者p=root 或者q=root
Linux启动或重启mysql失败:Job for mysqld.service failed because the control process exited with erro（多种解决方法）
CHANGCHENG125: 删除所有路径搞定
二叉树的锯齿形遍历，力扣
大数据ＳＱＬｂｏｙ: 二刷记录：如果先做过层序遍历的话，就会发现基本差不多这里主要是利用双端队列，头尾两端可添加元素关键的部分是对节点所在的节点的层进行判断，具体讲就是偶数层和奇数层，，剩下的部分跟层序遍历基本一致
二叉树的层序遍历，力扣
大数据ＳＱＬｂｏｙ: 三刷记录： BFS 的题型有层次遍历、最短路径思路简单理解就是由上至下逐层遍历两层循环，第一层是遍历整棵树，第二层是遍历遍历每一行（层）的节点内层循环逻辑操作：获取当前层节点值，同时获取下一层节点（即当前层的左右子树节点）外层循环逻辑操作就是汇总每一层遍历得到的节点值剩下就是创建存储的数据结构了
基数排序（经典、常见）
秋说: 博主你好，感觉你的文章质量很好，这边有一个合作，可以私信我或添加我文章底部联系方式哈~

大家在看

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。