Hive基本概念

最新推荐文章于 2023-01-26 21:03:17 发布

小财迷，嘻嘻

最新推荐文章于 2023-01-26 21:03:17 发布

阅读量625

点赞数

文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48185778/article/details/108623224

版权

1、什么是Hive？

基于Hadoop的数据仓库解决方案
将结构化的数据文件映射为数据库表
提供类sql的查询语言HQL（Hive Query Language）
Hive让更多的人使用Hadoop
为什么要使用Hive？
比如词频统计，mapreduce需要写一大堆代码，hive一条select就ok了；
由此可见，MapReduce执行效率更快，Hive开发效率更快。
所以，我们使用Hive是因为MapReduce太难用了。

2、Hive框架设计

基本构成（重要）
1、Hive将元数据存储在数据库中，如MySQL。Hive中的元数据包括表的名字、表的列和分区、表的属性、表的数据所在目录等一切描述数据的数据。
2、Hive的数据存储在HDFS中，大部分的查询、计算由MapReduce完成（但是包括* 的查询，比如select* from tabl不会生成MapReduce）。
3、解释HQL查询语句，生成查询计划存储在HDFS中，MapReduce调用执行。

3、Hive与Hadoop

Hive是一个工具，不用关心MapReduce逻辑，使用简单SQL语句完成查询。
Hive利用HDFS存储数据，利用MapReduce查询数据。

4、Hive数据类型（原始类型+复杂数据类型）

1、原始数据类型：类似于SQL数据类型

最低0.47元/天解锁文章

小财迷，嘻嘻

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive基本概念

二、Hive操作1、创建表文件数据如下：Michael|100|Montreal,Toronto|Male,30|DB:80|Product:DeveloperLeadWill|101|Montreal|Male,35|Perl:85|Product:Lead,Test:LeadSteven|102|New York|Female,27|Python:80|Test:Lead,COE:ArchitectLucy|103|Vancouver|Female,57|Sales:89,HR:94|Sal
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。