Hive入门教程

最新推荐文章于 2021-05-11 19:25:19 发布

藏红

最新推荐文章于 2021-05-11 19:25:19 发布

阅读量1.4w

点赞数 3

文章标签： Hive 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ch717828/article/details/48879867

版权

本文是Hive入门教程，介绍了Hive作为基于Hadoop的数据仓库，其功能包括ETL、SQL-like查询以及与Hadoop的集成。此外，还讲解了数据仓库的基本概念、Hive的体系结构，包括元数据、HQL执行过程和各种模式的安装。最后，涵盖了Hive的数据类型、存储方式，如内部表、分区表、外部表、桶表和视图，以及数据导入和查询操作。

摘要由CSDN通过智能技术生成

什么是Hive

(1)Hive是基于Hadoop之上的数据仓库

(2)Hives是建立在Hadoop HDFS上的数据库仓库基础架构

(3)Hive可以用来进行数据提取转换加载(ETL)

(4)Hive定义了简单的类似SQL查询语言，称为HQL它允许熟悉SQL的用户查询数据

(5)Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作

(6)Hive是SQL解析引擎，他将SQL语言转移成M/R Job然后在Hadoop执行

(7)Hive的表其实就是HDFS的目录/文件

什么是数据仓库

数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合，它用于支持企业或组织的决策分析处理

数据仓库的结构和建立过程

数据仓库模型

（1）星型模型

（2）雪花模型（基于星型模型发展起来）

Hive的体系结构

（1）Hive的元数据

hive将元数据存储在数据库中（metastore）,支持mysql、derby等

hive中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等

(2)HQL的执行过程

解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中，并在随后有MapReduce调用执行

(3)Hive体系结构

最低0.47元/天解锁文章

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

藏红 CSDN认证博客专家 CSDN认证企业博客

码龄13年

203: 原创

4万+: 周排名

33万+: 总排名

128万+: 访问

: 等级

1万+: 积分

101: 粉丝

364: 获赞

122: 评论

533: 收藏

私信

关注

热门文章

分类专栏

Linux 4篇
云原生 6篇
golang 2篇
docker 1篇
操作系统 2篇
二进制 1篇
前端 1篇
javascript 1篇
mysql 1篇
磁盘 1篇

最新评论

数据链路层和传输层可靠传输的超级困惑
跨考408小萌新: 我也困惑了一下可能书没编好两者不是同时存在的以太网的链路层是不可靠的没有使用SR，BGN等协议，提供不可靠传输，但可以由传输层使用TCP协议的保证，使用UDP可由应用层保证。TCP应答的是一个MSS（帧去掉链路层和ip层附加的信息），在TCP头里面有说名长度的。
计算机为什么要使用原码、反码、补码
S_E_E_K_: 请教一下，在用反码计算57-39时计算得到的结果是1（溢出舍去） 0001 0001转化为十进制是17而非18，这个是不是能说明反码计算除了在0处有误差在其他某些情况也不准确呢
Mysql 插入中文错误：Incorrect string value: '\xE7\xA8\x8B\xE5\xBA\x8F...' for column 'course' at row 1
中江盐亭YT: 单独列改不过来，错误的原因是因为数据库本身就是latin，把数据库的编码改了，重新建表就行
k8s：worke节点启动后，node处于NotReady状态
益达915: 感谢大神，补充一句是在master节点上重拉镜像
Mac虚拟机怎么打开 ctrl+alt+delete
weixin_42267887: 谢谢，帮助很大

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。