分布式数据仓库Hive

最新推荐文章于 2024-07-28 14:07:27 发布

Pink_floyd

最新推荐文章于 2024-07-28 14:07:27 发布

阅读量1.3k

点赞数 2

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42932834/article/details/89559781

版权

大数据专栏收录该内容

5 篇文章 3 订阅

订阅专栏

第六章：分布式数据仓库Hive

1.Hive的由来：(了解一个技术或者名词应该知道它产生的初衷)

为了便于熟悉SQL的传统数据库的开发人员使用Hadoop系统进行数据查询分析，开源社区基于Hadoop构建了一个可供进行数据查询分析的数据仓库Hive。Hive可直接用类似SQL的语言描述数据处理逻辑，避免开发人员在开发大数据查询分析处理程序时编写复杂的基于Java的MapReduece程序。Hive提供了HiveQL查询语言的编程接口，提供数据仓库所需要的数据抽取转换，存储管理和查询分析功能。

2.在Hive中使用了4个主要的数据模型：表，外部表，分区和桶。

3.Hive运行过程中，其元数据可能会不断被读取，更新和修改，因此这些元数据不宜存放再Hadoop的HDFS中，否则会降低元数据的访问效率，进一步导致Hive的整体性能。目前，Hive使用一个关系数据库来存储其元数据，Hive系统安装时自带了一个内置的小规模内存数据库Derby，但是Hive也可以让用户安装和使用其他存储规模更大的专业数据库，如MySQL。

4.Hive可通过三种模式连接到数据库：单用户模式，多用户模式，远程服务器模式。

5.Hive的查询语言—HiveQL
Hive主要支持以下几类操作：
(1).DDL：数据定义语句，包括CREATE,ALTER,SHOW,DESCRIBE,DROP等；
(2).DML：数据操作语句，包括LOAD DATA,INSERT。Hive设计中没有UPDATE，因为Hive中有时间戳。
(3).QUERY:数据查询语句，主要是SELECT语句。

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。