![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
未闻花名sunny
这个作者很懒,什么都没留下…
展开
-
复合主键做历史拉链表
分享技巧之前,先普及两个概念:1)什么是维度?维度是维度建模的基础和灵魂。在维度建模中,讲度量称为“事实”,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。例如,在分析新增过程中,可以通过平台、手机厂商、版本号等维度描述用户的属性。维度所包含的标识维度的列成为维度属性。维度属性是查询约束条件、分组和报表标签生成的基本来源,是数据易用性的关键。例如,在sql查询中,获取连信有头像和风控合法用户,是通过约束用户头像状态属性和风控级别属性来实现的;统计连信不同手机厂商的每日新增用户数,是通过用户手原创 2020-08-18 16:40:01 · 1016 阅读 · 0 评论 -
内部表与外部表详解
内部表&外部表定义:未被external修饰的是内部表(managed table),被external修饰的为外部表(external table);区别:内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse),外部表数据的存储位置由自己制定(如果没有LOCATION,Hive将在HDFS上的/user/hive/warehouse文件夹下以外部表的表名创建一原创 2020-08-13 14:52:36 · 6110 阅读 · 2 评论