改变Hive 表的分区


如果只想删除某一分区的数据,请使用以下命令:


> alter table t_bz drop partition (dt='2014-07-23');


如何保证t_bz表里面的数据每天都是新增,可以使用以下命令:

t_bz  是目标数据表,t_bz_tmp 是一张临时表,后者的用来存放每天新增的数据。


每天产生的数据放入临时表中使用load:


LOAD DATA LOCAL INPATH '/home/test/log.csv' OVERWRITE INTO TABLE t_bz_tmp;


insert into table t_bz partition(dt) select LogId,UserId,ClientVersion, ActionTime,dt  from t_bz_tmp  where  (dt = DATE_FORMAT(actiontime,' yyyy-MM-dd' ));


dt的内容是"2014-08-05" 这样的,actiontime的 “2014-08-05 02:23:11”


通过hive的动态分区功能,保证t_bz的数据每天产生一个新的分区,已经存在的分区数据都是不会发生变化的。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值