Hive 分区表和二级分区表的基本操作

最新推荐文章于 2024-09-25 11:18:24 发布

小马哥_编程

最新推荐文章于 2024-09-25 11:18:24 发布

阅读量9.2k

点赞数

分类专栏：大数据 hadoop Hive

本文链接：https://blog.csdn.net/xiaomage510/article/details/82669805

版权

本文介绍了Hive分区表的概念，通过创建、加载数据、查询、增加和删除分区的操作，详细阐述了如何使用Hive进行数据管理。同时，讲解了二级分区表的创建及数据导入，探讨了Hive分区数据的关联方法。

摘要由CSDN通过智能技术生成

Hive分区就是在HDFS上创建独立的文件夹，该文件夹下是该分区的所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择来查询所需要的指定分区，这样的查询效率会提高很多。

1、引入分区表

最终呈现的效果就是在HDFS上按照分区的目录存储文件：

/user/hive/warehose/log/201801/01/dept.log

/user/hive/warehose/log/201801/02/dept.log

/user/hive/warehose/log/201801/03/dept.log

2、创建分区表

创建分区的关键语句是partitioned by (分区名类型)：

create table dept_partition(
 deptno  int,dname  string,loc  string
)
partitioned by (month string)
row format delimited fields terminated by '\t';

3、加载数据到分区表中

load data local inpath '/opt/module/datas/dept.txt' into table dept_partition partition(month='201801');

4、查询分区表中的数据

单分区查询：

select * from dept_partition where month='201801';

多分区联合查询：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小马哥_编程

关注关注

0
点赞
踩
14

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hive创建二级分区表

Ganymede的Hadoop世界

10-14

7159

Hive创建二级分区表.

hive 分区表select全部数据_Hive分区表实战

weixin_28726671的博客

01-14

750

1. Hive分区表Partition和Bucket，为了提升查询效率，前者是粗粒度的划分，后者是细粒度的划分。建表语句中使用partitioned by指定分区字段分区表有静态分区和动态分区两种。若分区的值是确定的，那么称为静态分区字段，反之，若分区的值是非确定的，那么称之为动态分区字段。默认是采用静态分区。2. 静态分区应用场景1每天有很多不同的商店各自会产生成百上千的销售记录，当天的数据当天...

4 条评论您还未登录，请先登录后发表或查看评论

hive中的2级分区表的创建

qq_43192537的博客

09-23

2212

hive中的2级分区表的创建解释：就是多级文件夹 1．创建二级分区表 hive (default)> create table dept_partition2( deptno int, dname string, loc string ) partitioned by (month strin...

hive如何删除分区

最新发布

别人笑我太疯癫，我笑他人看不穿。

09-25

1155

在Hive中，删除分区是一个常见的操作。你可以使用ALTER TABLE DROP PARTITION语句来删除一个或多个分区。

hive二级分区

zhong's blog

03-04

1184

几年前的工作了，放在草稿箱2，3年了，整理一下吧。内容主要是扩展了hive的分区方式，原生的hive支持多字段等值分区，对于很有用的range、hash、list等数据库传统的分区方式不支持，因此这个做了二级的多类分区的扩展。这里只是antlr的定义，显然你还需要在查询、存储层做更多的工作来支持这种分区工作，量还是不小的，我们的工作不具参考性，这里只列一下sql解析的修改，给大家做...

Hive 动态分区和二级分区

天道酬勤

04-28

1061

一、参数配置开启动态分区功能 set hive.exec.dynamic.partition=true; 允许所有分区都是动态的 set hive.exec.dynamic.partition.mode=nonstrict; 其他相关参数调优每个 mapper 或者 reducer 可以允许创建的最大分区数，默认是100 set hive.exec.max.dynamic.partitio...

【Hive-基础】分区表，二级分区，动态分区，分桶表

一个写湿的程序猿

08-03

2950

分区表，二级分区，动态分区，分桶表文章目录分区表，二级分区，动态分区，分桶表分区表与分桶表的区别？分区表1 分区表基本操作2 分区表二级分区3 动态分区调整分桶表 分区表与分桶表的区别？ 1） 分区表：使用的是表外字段（表中不存在的字段），需要指定字段类型；分桶表：使用的是表内字段（表中存在的字段），已经知道字段类型，不需要指定。 2） 分区表：通过关键字partitioned by(partition_name string)声明，分桶表：通过关键字clustered by(column_name)

Hive的分区表

01-20

Hive分区表 Hive分区表对应的是HDFS上独立的文件夹，该文件夹存放的是该分区的所有数据，其实分区就是分目录。Hive通过分区把一个大的数据集根据业务需要分割成小的数据集，在查询时能够通过where关键词选择指定分区...

hive分区表分通表建表语句详解和例子

11-01

### Hive 分区表与分桶表详解 #### 一、Hive 分区表概念与应用场景 ...通过对以上Hive分区表的概念、创建方法及管理操作的了解，我们可以更加高效地管理和查询大型数据集，从而提高数据分析的效率和准确性。

7.Hive基础—分区表(基本操作、二级分区、动态分区调整)、分桶表(创建、注意事项、Insert导入数据)、抽样查询

页川叶川

08-20

1527

本文目录如下：第7章 分区表和分桶表7.1 分区表7.1.1 分区表基本操作7.1.2 二级分区7.1.3 动态分区调整7.2 分桶表7.3 抽样查询第7章 分区表和分桶表 7.1 分区表 分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive 中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。 7.1.1 分区表基本操作 1）引入分区表（需

hive笔记（六）：分区表和分桶表-分区/二级分区/抽样查询/动态分区调整

qq_55906442的博客

08-28

824

分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定分区，这样的查询效率会提高很多。...

Hive分区表

weixin_44246850的博客

01-11

3565

1、为什么设立分区表 在大量数据需要查询时，虽然可以通过where进行筛选，但也是检索整个数据表后得到的结果。而将一个大的数据集根据实际需要分割成各个小型数据集，再通过where选择需要查询的分区，故而效率大大提高。 2、分区表实质 Hive中的分区是将一个文件分割成各个目录（文件）。 3、分区表语法 3.1建立分区表 create table 分区表名称（字段名称1 数据类型，字段名称2 数据类型，。。。字段名称n 数据类型） partitioned by（分区

Hive - 分区表

weixin_40968325的博客

04-22

2053

Hive中的分区就是把一张大表的数据按照业务需要分散的存储到多个目录，每个目录就称为该表的一个分区。在查询时通过where子句中的表达式选择查询所需要的分区，这样的查询效率会提高很多。将一张大表按照某个字段进行划分划分到多个文件夹中每个文件夹内部存储一部分表内容这样的表结构就被称之为分区表分区的好处:1. 方便数据管理2. 加快查询效率不再执行过滤操作。

Hive分区

chy2z的专栏

07-14

412

创建分区表 dt 是分区列create table pt1 (id int, name string) partitioned by (dt string) row format delimited fields terminated by ',' stored as textfile;增加分区alter table pt1 add partition (dt='2018-07-13');删除分区...

hive 分区表 静态动态分区

qq_43192537的博客

09-22

4332

hive 分区表 静态动态分区

Hive分区之再述分区（增删改查）

m0_64644104的博客

04-20

472

大数据时代，就是我们现在生存的时代，我们的每一点一滴、一举一动如何能逃脱得出数据的束缚。有不少豪杰侠士引领着我们走向hive江湖，五大帮派与六大派别的利益纷争不断，战火不断蔓延，出于对整个数码武林的公平正义，少林（分区）和武当（分桶）受广大码农相邀，主持公道。今天让我们看看少林是如何用十八般武艺征服整个江湖。`提示：此文章仅代表张医师个人观点。

hive分区笔记

长街旧人

01-28

1686

hive分区 1.一级分区 Hive 中的分区就是分目录。和Map中的切片是基本一致的。Map的切片也是为了提高并行度。把表中的数据分开放，当你查表里数据的时候写上分区信息，避免全表扫描; 是一个优化的方案。 分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive 中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。 2.创建分区表 注:分区字

Hive分区表增删改查

qq_43193797的博客

01-11

738

1 分区表 分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。 1.1 分区表基本操作 1．引入分区表（需要根据日期对日志进行管理） /user/hive/warehouse/log_p...

Hive分区表：提高查询效率的秘诀

="China",state="Asia"); 分区表在大数据处理中...Hive分区表是大数据处理中的重要工具，合理利用分区策略可以极大提升数据管理和查询效率。在设计和使用分区表时，应充分考虑业务场景和查询需求，以达到最佳效果。