Hive分区表

最新推荐文章于 2024-07-29 20:39:23 发布

zhaoxiaoba123

最新推荐文章于 2024-07-29 20:39:23 发布

阅读量340

点赞数

分类专栏： Hive 文章标签： hive 大数据 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaoxiaoba123/article/details/108352044

版权

Hive 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive 中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。

创建分区表语法

查询分区表中数据

增加分区

删除分区

同时删除多个分区

查看分区表有多少分区

查看分区表结构

创建二级分区表

加载数据到二级分区表中

查询分区数据

把数据直接上传到分区目录上，让分区表和数据产生关联的三种方式

方式一:上传数据后修复

上传数据

dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=201709/day=12;
dfs -put /home/hadoop/data/dept.txt /user/hive/warehouse/dept_partition2/month=201709/day=12;

查询数据(查询不到刚上传的数据)

select * from dept_partition2 where month='201709' and day='12';

执行修复命令

msck repair table dept_partition2;

再次查询数据

select * from dept_partition2 where month='201709' and day='12';

方式二:上传数据后添加分区

上传数据

dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=201709/day=11;

dfs -put /home/hadoop/data/dept.txt /user/hive/warehouse/dept_partition2/month=201709/day=11;

执行添加分区

alter table dept_partition2 add partition(month='201709',day='11');

查询数据

select * from dept_partition2 where month='201709' and day='11';

方式三:创建文件夹后 load 数据到分区

创建目录

dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=201709/day=10;

上传数据

load data local inpath '/home/hadoop/data/dept.txt' into table dept_partition2 partition(month='201709',day='10');

查询数据

select * from dept_partition2 where month='201709' and day='10';

修改表

重命名表

ALTER TABLE table_name RENAME TO new_table_name

实操案例

alter table dept_partition2 rename to dept_partition3;

增加、修改和删除表分区

添加列

alter table dept_partition add columns(deptdesc string);

更新列

alter table dept_partition change column deptdesc desc int;

替换列

alter table dept_partition replace columns(deptno string, dname string, loc string);

删除表

drop table dept_partition;

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zhaoxiaoba123 CSDN认证博客专家 CSDN认证企业博客

码龄8年

111: 原创

7万+: 周排名

114万+: 总排名

13万+: 访问

: 等级

1181: 积分

34: 粉丝

17: 获赞

14: 评论

165: 收藏

私信

关注

分类专栏

python爬虫 12篇
APP逆向 13篇
mysql 10篇
Kafka 2篇
flume 1篇
Storm 14篇
scala 5篇
Sqoop 1篇
Zookeeper 1篇
Azkaban 3篇
Spark 8篇
Hadoop 15篇
Hive 14篇

最新评论

电商项目实战Hadoop实现
n_53206: 求源码和数据库
瑞数 4 逆向 js 分析过程
2301_80120875: 同问怎么排查3个参数
瑞数 4 逆向 js 分析过程
打转的猫咪: 大佬，想问一下在：15、咱们开始求_&OJ 生成处现在非常主要就是求出这三个参数了这个，是怎么排查到要看这几个参数呢
objection 基础案例一
william_King1024: 大佬的示例 APP junior在哪下载的哇
Hadoop OOTB环境
qq_42694738: 同问，这个OOTB有下载地址吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。