partitioned for hive

Hive中,建立最简单的table,然后从文件导入数据 带分区参数partitioned。

1、单字段,不指定分隔符,如下:


<span style="font-size:14px;">#建表so_popu_281
hadoop fs -mkdir '/home/helh/solog/so_popu_281'
hive -e "
drop table if exists so_popu_281;
create external table so_popu_281(
str string
)
partitioned by (pdate string)
location '/data/log/so/re/popu_281/'
"

pre_day=`date --date '-1 days' +%Y-%m-%d`
hadoop fs -cat "/data/log/re/pdate=$pre_day/re.$pre_day.117.122.217.6"|grep 'popu_281' >./popu_281.txt
#导入文件
hive -e "load data local inpath 'popu_281.txt' into table so_popu_281 partition (pdate='$pre_day')"</span>

2、指定分隔符

带分区的表定义语句

<span style="font-size:14px;">create table people(
id STRING,
name STRING,
likes ARRAY<string>,
addr MAP<string,string>
)
partitioned by (dt string)
ROW FORMAT DELIMITED
 FIELDS TERMINATED BY '\t'
 COLLECTION ITEMS  TERMINATED BY ','
 MAP KEYS  TERMINATED BY ':'
STORED AS TEXTFILE;</span>

最后导入的命令也不一样,这里其实就是按照DT这个字段来分区的

<span style="font-size:14px;">load data local inpath '/tmp/test.txt' into table people PARTITION (dt='2016-1-1')</span>

 

更多讲解请看看官网


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值