hive创建分区表

最新推荐文章于 2024-07-29 20:39:23 发布

刘s泽

最新推荐文章于 2024-07-29 20:39:23 发布

阅读量5.9k

点赞数

分类专栏：已解决问题

本文链接：https://blog.csdn.net/qq_16760101/article/details/94634079

版权

已解决问题专栏收录该内容

15 篇文章 0 订阅

订阅专栏

静态分区去掉源数据分区列后执行（记得指定ymd=‘2019-10-10’）：
1.创建分区表
CREATE TABLE temp (
pile smallint,
mp smallint,carownerint,hmsint ） partitioned by (ymd` int
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘\t’
STORED AS parquet;
2.加载数据，用sparksql
insert overwrite table test.rcd partition(ymd=‘2019-10-10’) select * from cr
动态分区不需要指定ymd=‘2019-01-01’,但是要将源数据ymd字段移动到最后一列

分区表中分区列在hive表中会成为一列或几列，但是在实际hdfs上的数据中分区列仅代表目录，在实际数据中并没有这些数据，因此，经常要删除掉源数据表中被用来分区的列，为了对应hdfs实际的列数。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

刘s泽

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
hive创建分区表

源文件中要删除ymd1.创建分区表CREATE TABLE temp (pile smallint,mp smallint,carownerint,hmsint ） partitioned by (ymd` int)ROW FORMAT DELIMITEDFIELDS TERMINATED BY ‘\t’STORED AS parquet;2.加载数据，用sparksqli...
复制链接

扫一扫