数据仓库
信念随梦
本博客的主要作为自己的学习笔记,并不是以教授知识为目的。如果有人能从我的博客中学到东西,我很高兴。有人发现文章中有不对的地方,也欢迎大家纠正。
展开
-
自然键 or 代理键
概念解释键:键是唯一标识一个实体的一个或者多个数据属性。在物理数据库中,建可以由变的一个或者多个列组成,它们的值唯一标识关系表中的一行自然键:由现实时间中已经存在的数据组织成的键,字段本身具有一定的含义;例如,身份证号、员工编号等代理键:就是充当主键的字段本身不具有业务意义,只具有主键作用,比如自动增长的ID比如商品,在ETL过程中,对于商品维表的每一行,可以生成一个唯一的代理键与之对应; 商品本身的自然键可能是商品ID等。其实对于前台应用系统来说,商 ID是代理键:而对于数据仓库系统.原创 2020-07-05 11:14:40 · 3757 阅读 · 1 评论 -
DB、ETL、DW、OLAP、DM、BI关系结构图
在此大概用口水话简单叙述一下他们几个概念:(1)DB/Database/数据库——这里一般指的就是OLTP数据库,在线事物数据库,用来支持生产的,比如超市的买卖系统。DB保留的是数据信息的最新状态,只有一个状态!比如,每天早上起床洗脸照镜子,看到的就是当时的状态,至于之前的每天的状态,不会出现的你的眼前,这个眼前就是db。(2)DW/Data Warehouse/数据仓库...转载 2018-08-25 17:28:49 · 777 阅读 · 0 评论 -
Lambda架构&Kappa架构
在大数据3.0时代,Lambda大数据架构已经无法满足企业用户日常大数据分析和敬意运营的需要,去ETL化的IOTA大数据架构才是未来。Lambda架构 Lambda 是用Nathan Marz(实时处理框架storm的作者) 提出的用于同时处理离线和实时的数据的,可容错的,可扩展的分布式系统。它具备强鲁棒性,提供低延迟和持续更新。它通过批量MapReduce作业提供了虽有些延迟但是...原创 2019-01-27 16:01:07 · 4252 阅读 · 0 评论