Hive的分区问题以及hdfs映射到Hive的过程

在创建Hive表时,字段分区是一个非常非常容易导致将来遇到问题的一个地方,我们常常将时间日期来作为分区字段。 

考虑到数据源之间的转换,日期字段作为分区时,不要用date类型!

 

oracle的date类型只支持全格式的数据类型,就是yyyy-MM-dd hh:mm:ss,而Hive则时yyyy-MM-dd,oracle导数据到Hive中,系统会自动截掉后面的时分秒,然而反过来,就不会!!!  所以会导致导入不成功!

 

建议用string类型来做分区字段的类型

 

Hive分区表映射Hdfs的数据的步骤分为以下几个部分:

1、Hive建表建分区

2、HDFS创建相关Hive的物理地址(hadoop fs -mkdir xxxxx/xxxxx/精确到分区的那个目录)

3、Hive执行 Alter table add partition(xxxx===)添加新的分区

4、到Hive查询相关分区与数据验证是否插入

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值