初识Hive

最新推荐文章于 2024-07-19 15:43:20 发布

localhost_rachel

最新推荐文章于 2024-07-19 15:43:20 发布

阅读量130

点赞数

分类专栏：大数据组件文章标签： hive 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31071543/article/details/115025515

版权

大数据组件专栏收录该内容

3 篇文章 1 订阅

订阅专栏

HiveSQL是一种类似于SQL语言的工具，作为海量数据分析的SQL查询引擎，因相对简单易上手，被越来越多的人使用与喜爱，比如我们常见的数据分析师、BI报表工程师、数仓工程师等岗位，这些岗位的同事们基本上都是HiveSQL的粉丝（包括我也是）。下面就大概记录一下自己对HiveSQL的认识。

理解Hive

基于Hadoop的数据仓库工具，对MapReduce的一个封装，底层就是MapReduce程序，HiveSql替代了复杂的MapReduce程序
将Hdfs中的结构化数据映射为一张虚表，并提供sql查询语句
Hive没有服务端，它的本质是Hdfs的客户端，对Hdfs中的数据与 Meta store中的元数据进行操作

Hive的架构与原理

2个客户端

CLC命令行客户端（在shell上执行脚本）

JDBC客户端

4个驱动器

SQL Parser解析器：检查sql语法是否正确

Pysical Plan编译器：把sql转换为MapReduce任务

Query Optimizer优化器：优化sql查询语句

Execution执行器：执行MapReduce任务

元数据Meta Store

Meta Store用来存放Hive的元数据信息，如Hive中的表名、列/分区字段、表的类型（内部表or外部表）、表所属数据库、表所在的目录、表的用户权限等

Meta Store默认存放在Hive自带的derby数据库中，但derby无法实现并发，所以Meta Store一般存放在外部mysql数据库中

通过元数据信息能找到表字段，然后把表字段映射到结构化数据中，最终形成一张虚表

Hive与常规数据库的区别

数据存储的位置

Hive处理的结构化数据存放在Hdfs上，元数据一般放在外部mysql数据库中

数据库是把数据放在块设备或本地文件系统中

数据的更新

Hive适用于静态数据，主要用作数据的查询与分析

数据库适用于动态数据，主要用作数据的实时更新

执行的机制

Hive的查询引擎一般是Hadoop的MapReduce

数据库的查询引擎一般是InnerDB

执行的延迟

Hive没有索引，通过MapReduce执行查询任务，延迟比较高

数据库延迟低，但不适合做海量数据查询

扩展性

Hive构建在Hadoop上，可扩展性强，支持并发运行

数据库可扩展性差

参考文章

https://blog.csdn.net/wx1528159409/article/details/84667658

localhost_rachel

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
初识Hive

HiveSQL是一种类似于SQL语言的工具，作为海量数据分析的SQL查询引擎，因相对简单易上手，被越来越多的人使用与喜爱，比如我们常见的数据分析师、BI报表工程师、数仓工程师等岗位，这些岗位的同事们基本上都是HiveSQL的粉丝（包括我也是）。下面就大概记录一下自己对HiveSQL的认识。理解Hive基于Hadoop的数据仓库工具，对MapReduce的一个封装，底层就是MapReduce程序，HiveSql替代了复杂的MapReduce程序将Hdfs中的结构化数据映射为一张虚表，并提供sql.
复制链接

扫一扫

专栏目录

localhost_rachel CSDN认证博客专家 CSDN认证企业博客

码龄9年

63: 原创

8万+: 周排名

178万+: 总排名

17万+: 访问

: 等级

1697: 积分

18: 粉丝

32: 获赞

12: 评论

191: 收藏

私信

关注

热门文章

分类专栏

最新评论

关于case when复杂sql语句查询
totuo: 想问一下，这个为什么查询的时候，要给status字段值加上单引号呢？有什么特别的作用吗
Maven mirrorOf配置
洛琪睿demo: Setting.xml中repository的配置优先级更高
Maven mirrorOf配置
Java软件工程师: 【mirrorOf那块原理不明白的看这篇就够了】https://blog.csdn.net/Elma_Programmer/article/details/117222954
初识Ranger用户权限管理
不吃西红柿丶: 写得挺好，要持续稳定输出哦~
Maven mirrorOf配置
小饼干超人: 还有，要注意的是，settings.xml一般有两个位置，局部位置（./m2/settings.xml）的优先级大于全局配置(maven安装目录/conf/settings.xml)

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。