Hive分区表

最新推荐文章于 2024-05-10 07:38:43 发布

SuperDoge

最新推荐文章于 2024-05-10 07:38:43 发布

阅读量566

点赞数

分类专栏： Hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43579121/article/details/86591033

版权

Hive 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

概念：Hive的表有两种：内部表和外部表；并且都可以是分区表。

作用:可以避免查询整表，在生产环境下，基本都是建立带有分区字段的表，在查询时，带上分区条件。

分区表在HDFS，一个分区，就对应一个目录。

分区表的实际应用：一般是以天为单位来建立分区，这样方便管理表数据，尤其是按日期查询很方便。

比如：

普通表和分区表区别：有大量数据增加的需要建分区表。

语法：create table xxx（字段） partitioned by （xxx string） row format delimited fields terminated by ‘切割格式’；（注：在创建分区表时，partitioned字段可以不再字段列表中。生成的表中自动就会有该字段。xxx自定义分区字段，根据xxx进行分区）

分区表加载数据

load data local inpath '数据路径' overwrite into table book partition （xxx=‘区名’）；

例：

查询语句：select * from book where xxx=‘区名’;

通过创建目录来增加分区

如果想现在HDFS的目录项，自己创建一个分区目录，然后在此目录下上传文件，比如：

此时手动创建目录是无法被hive使用的，因为元数据库中没有记录该分区。需要将自己创建的分区也能被识别，需要执行：

ALTER TABLE xxx add PARTITION(category='区名') location '分区路径';

分区命令

1.显示分区：show partitions iteblog；

2.添加分区：alter table xxx add partition(xxx='..') location 'lujing'; 或者 msck repair table xxx；

3.删除分区:alter table xxx drop partition(xxx='..');

4.修改分区:alter table book partition (xxx='aa') rename to partition (xxx='bb');

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hive分区表

概念：Hive的表有两种：内部表和外部表；并且都可以是分区表。作用:可以避免查询整表，在生产环境下，基本都是建立带有分区字段的表，在查询时，带上分区条件。分区表在HDFS，一个分区，就对应一个目录。分区表的实际应用：一般是以天为单位来建立分区，这样方便管理表数据，尤其是按日期查询很方便。比如：普通表和分区表区别：有大量数据增加的需要建分区表。语法：create table ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。