【Hive】Hive基础1

最新推荐文章于 2023-04-23 23:32:14 发布

大岛君

最新推荐文章于 2023-04-23 23:32:14 发布

阅读量279

点赞数

分类专栏：面试笔记文章标签： hive基础

本文链接：https://blog.csdn.net/myloveprogrmming/article/details/102687244

版权

217 篇文章 0 订阅

订阅专栏

一、什么是Hive

1基于Hadoop的数据仓库解决方案

2将结构化的数据文件映射为数据库表

3提供类sql的查询语言HQL

二、Hive的优势和特点

1、提供了一个简单的优化模型

2、HQL类SQL语法，简化MR开发

3、支持在不同的计算框架上运行

4、支持用户自定义函数

三、Hive元数据管理

默认由 Derby数据库管理

实际用Mysql，修改配置文件hive-site.xml

四、原始数据类型

五、复杂数据类型

ARRAY：存储的数据为相同类型

MAP:具有相同类型的键值对

STRUCT:封装了一组字段

类型	格式	定义	示例
ARRAY	[‘Apple’,’Orange’,’Mongo’]	ARRAY<string>	a[0] = ‘Apple’
MAP	{‘A’:’Apple’,’O’:’Orange’}	MAP<string, string>	b[‘A’] = ‘Apple’
STRUCT	{‘Apple’, 2}	STRUCT<fruit:string, weight:int>	c.weight = 2

六、Hive元数据结构

分区和分桶的区别：都是用于分割数据，为了提高查询效率，区别是分区在HDFS表现为一个表文件夹下的子文件夹，分桶表现为同一目录下的文件。

关注