深入理解 Hive

最新推荐文章于 2022-06-08 09:57:12 发布

五道口纳什

最新推荐文章于 2022-06-08 09:57:12 发布

阅读量1.4k

点赞数

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lanchunhui/article/details/50910656

版权

hadoop 专栏收录该内容

45 篇文章 0 订阅

订阅专栏

直接在 Linux 命令行环境下执行 hive 命令

hive -e “”

[root@hadoop0 ~]# hive -e "create table t1(name string);"

分区表

hive> create table t1(id int) partitioned by (day int);

Hive 把表组织成“分区”（partition）。这是一种根据“分区列”（partition column，如日期）的值对表进行粗略划分的机制。使用分区可以加快数据分片（slice）的查询速度。

（1）分区表的适用场景

每天产生一个文件夹，可根据日期建立分区表，这样就避免了对所有的目录进行全表扫描；
（2）关键字：partitioned by ()

后边小括号跟的内容，作为一个单独的列，为分区列“partition column”，这也是分区的划分依据

分区表的创建流程：

（1）创建分区表（指定“分区列” partition column）

create external table hmbbs(ip string, atime string, url string) partitioned by (logdate string) row format delimited fields terminated by ‘\t’ location ‘/hmbbs_cleaned’

此时表中未有数据，因为未增加分区
（2）增加分区

alter table hmbbs add partition(logdate=2013_05_30) location ‘/hmbbs_cleaned/2013_05_30’；

外部表

通过外部文件（hdfs 上的文件）的数据信息创建自己的表，关键字：external、location；

hive> create external table t5(id int) location '/external';

五道口纳什

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
深入理解 Hive

1. 分区表
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

五道口纳什 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。