最近工作中使用到了Hive, 并对Hive 的数据库,表完成创建。
创建的表为分区表,也涉及到了分区表 的按天动态增加分区。
代码组织结构:
创建数据库:
create_dmp.hql
--dmp 数据库存储了dmp所需要的数据
CREATE DATABASE IF NOT EXISTS `dmp`
WITH DBPROPERTIES ('creator' = 'sunzhenhua', 'create_date' = '2018-06-07');
执行创建命令
hive -f create_dmp.hql
创建表:
create_clearlog.hql
--dmp_clearlog 存放了清洗过后的投放信息--分区表: 按天分区--外部表
USE dmp;
CREATE EXTERNAL TABLE IF NOT EXISTS `dmp_clearlog` (
`date_log`string COMMENT 'date in file',
`hour`int COMMENT 'hour',
`device_id`string COMMENT '(android) md5 imei / (ios) origin mac',
`imei_orgin`string COMMENT 'origin value of imei',
`mac_orgin`