Hive总结

最新推荐文章于 2024-06-06 11:36:55 发布

星是河的眼

最新推荐文章于 2024-06-06 11:36:55 发布

阅读量3.6k

点赞数

分类专栏：大数据文章标签： hive hadoop mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43770110/article/details/122523023

版权

大数据专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

1. 概念
2. Hive与Hadoop的关系
3. Hive中的命令
4. Hive中的四种表结构

1. 概念

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL).
其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更进一步可以说hive就是一个MapReduce的客户端.

2. Hive与Hadoop的关系

Hive利用HDFS存储数据,利用MapReduce查询分析数据.
运行步骤:
1.客户端发出SQL
2.Hive处理,转换成MapReduce
3.提交任务到Hadoop
4.MapReduce运行

3. Hive中的命令

3.1 创建数据库并指定hdfs存储位置

create database myhive2 location ‘/myhive2’;

3.2 修改数据库

可以使用alter database 命令来修改数据库的一些属性。但是数据库的元数据信息是不可更改的，包括数据库的名称以及数据库所在的位置
alter database myhive2 set dbproperties(‘createtime’=‘20210611’);

3.3 查看数据库信息

查看基本信息:
desc database myhive2;
查看详细信息:
desc database extended myhive2;

3.4 创建表并指定字段之间的分隔符

create table if not exists stu2(id int ,name string) row format delimited fields terminated by ‘\t’ stored as textfile location ‘/user/stu2’;

4. Hive中的四种表结构

4.1 内部表

删除表同时会删除HDFS上的数据

4.2 外部表

删除表HDFS上的数据保留(测试发现删除所在库数据会没)

4.3 分区表

按条件将数据放在HDFS上的不同目录中

4.4 分桶表

先创建普通表,然后依据普通表创建分桶表,分桶表主要用来采样.分桶表实质就是把HDFS上存储的某文件分成多份另外存储.

星是河的眼

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Hive总结

文章目录1. 概念2. Hive与Hadoop的关系3. Hive中的命令3.1 创建数据库并指定hdfs存储位置3.2 修改数据库3.3 查看数据库信息3.4 创建表并指定字段之间的分隔符4. Hive中的四种表结构4.1 内部表4.2 外部表4.3 分区表4.4 分桶表1. 概念Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL).其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了hiv
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。