hive数据挂载到Amazon S3时的问题

一、hive数据存放到S3时问题归纳

1.添加分区问题

alter table tableName add if not exists partition (dt='$day') location 's3://$day - (S3路径)';

正常hive表添加分区是默认建立我们指定的分区,在s3上使用默认语句会添加一个dt=日期的一个文件夹,而正常分区目录没有“dt=“,这时需要手动指定数据路径,即在partition后面添加location指定S3数据分区路径。

 

2.建表S3路径问题

正常S3路径为s3://,infocS3路径s3n://,我们使用的是s3a://,默认S3底层协议都会解析出后面两种,一般情况下不需要改动。如果当我们指定s3://创建目录后,发现添加分区不生效时,有可能走hive的时候没有解析成功,需要手动将s3://改成s3a://。

 

3.数据格式

(1)LZO

         STORED AS INPUTFORMAT 'com.hadoop.mapred.DeprecatedLzoTextInputFormat'

(2)ORC

        STORED AS ORC;

(3)snappy.orc

       STORED AS ORC
       TBLPROPERTIES ("orc.compress"="SNAPPY")

(4)txt

       Stored as textfile;

 

4. jets3t-0.9.

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值