为什么要自建落地表
1、公司的大数据资源非常紧张,
2、导数逻辑很复杂;
3、日常导数要求时效性高;
4、部门数仓的表太多字段;
综上四点,还有其他的原因;都需要我们自己落建地表,方便自己查询,以及加快BI报表直接用复杂的SQL语句跑数时间。
HIVE SQL创建内/外部表、分区表
1、创建内部表:
CREATE TABLE `test`(
`order_id` decimal(22,0) COMMENT '源表自增id',
`kh_code` string COMMENT '客户编码',
`user_name` string COMMENT '用户名',
`kh_name` string COMMENT '客户姓名',
`company` string COMMENT '子公司名称',
`kh_lx` string COMMENT '客户类型',
`lx_ren` string COMMENT '联系人',
`cell_num` string COMMENT '手机号码',
`sale_ren` string COMMENT '销售人员',
`customer_service` string COMMENT '客服人员',
`status` string COMMENT '状态')
COMMENT '杂费类型维度表' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\001' STORED AS
textfile LOCATION '/bigdata/test'
执行语句后,没有报错;则创建表成功
desc test
--查看自建表的字段
输出结果:
备注:数据类型一列,如果是时间可以用时间戳:timestamp,数值可以用decimal(32,10),后面的10是保留的小数点位数;
1、创建外部表:
CREATE EXTERNAL TABLE `test