hive按当天日期建立分区表 | 动态往日期分区插入数据

hive建立分区表,以当天日期(“2014-08-15”)作为分区依据,hql如下:

CREATE EXTERNAL TABLE IF NOT EXISTS product_sell(
category_id BIGINT,
province_id BIGINT,
product_id BIGINT,
price DOUBLE,
sell_num BIGINT
)
PARTITIONED BY (ds string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
然后以日期作为分区依据,插入数据,shell脚本如下:

#!/bin/bash
source /etc/profile;

yesterday=$(date -d '-1 day' '+%Y-%m-%d')
lastweek=$(date -d '-1 week' '+%Y-%m-%d')

/usr/local/cloud/hive/bin/hive<<EOF 
INSERT OVERWRITE TABLE product_sell PARTITION (ds='$yesterday') select a.category_id, b.good_receiver_province_id as province_id, a.id as product_id, (b.sell_amount/b.sell_num) as price, b.sell_num from product a join (select si.product_id, s.good_receiver_province_id, sum(si.order_item_amount) sell_amount, sum(si.order_item_num) sell_num from so_item si join so s on (si.order_id=s.id) where si.is_gift=0 and si.is_hidden=0 and si.ds between '$lastweek' and '$yesterday' group by s.good_receiver_province_id, si.product_id) b on (a.id=b.product_id);
EOF

原文:https://blog.csdn.net/yeweiouyang/article/details/38589281 

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Hive是一种基于Hadoop的数据仓库工具,它提供了一种类似于SQL的查询语言HQL来对数据进行处理。当向Hive插入数据时,可以使用动态分区来指定数据应该存储在哪些分区中。动态分区是一种可以根据数据行中的某些条件动态生成的分区键,通常用于将数据根据不同的条件进行分类存储。 要向Hive插入数据动态分区,可以按照以下步骤进行操作: 1. 创建包含动态分区的表:首先,需要创建一个Hive表,并指定其中的分区键。这些分区键可以根据数据行的条件动态生成。 ```sql CREATE TABLE your_table ( -- 其他列定义 ) PARTITIONED BY (dynamic_partition_key column_type) ``` 在上面的语句中,`your_table`是表的名称,`dynamic_partition_key`是动态分区的键名,`column_type`是该键对应的列类型。 2. 插入数据到表:使用INSERT INTO语句将数据插入到表中。在INSERT INTO语句中,可以使用VALUES或SELECT语句来指定要插入数据。 ```sql INSERT INTO TABLE your_table PARTITION (dynamic_partition_key = value) VALUES (value1, value2, ...); ``` 或者 ```sql INSERT INTO TABLE your_table SELECT value1, value2, ... FROM other_table; ``` 在上面的语句中,`value`是动态分区键的值,可以根据数据行的条件动态生成。你可以根据实际情况替换为实际的值或查询结果。 需要注意的是,动态分区键的值可以是任何有效的Hive列类型,包括字符串、整数、日期等。同时,动态分区键的值需要在插入数据之前进行适当的处理和转换,以确保其符合分区的条件和要求。 通过上述步骤,你可以将数据插入Hive中的动态分区中。请确保在插入数据之前已经创建了包含动态分区的表,并根据实际情况调整表结构和插入语句中的列类型和值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值