![](https://img-blog.csdnimg.cn/fb49637169464f9bbd4532e190e8cf66.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据仓库
是一个面向主题的,集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。
Alienware^
喜欢专研Java,Scala,Python,数据库,以及大数据框架系列知识。希望通过不断的学习,记录自己的点点滴滴。
展开
-
数仓分层的好处
分层好处:1,复杂问题简单化:将复杂的任务分解成多层来完成,每一层只处理简单的任务,方便定位问题2,减少重复开发:规范数据分层,通过中间层数据,能够减少极大的重复计算,增加计算一次的结果的重复性3,隔离原始数据:不论是数据的异常还是数据的敏感性,使真实数据与统计数据解耦开数据集市和数据仓库的区别:数据集市是微型数据仓库,通常有更少的数据,更少的主题,更少的历史数据,是部门级别的,一般只能为某个局部范围内的管理人员服务数据仓库是企业级的,能为整个企业各个部门的运行提供决策支持手段。...原创 2021-09-18 18:10:18 · 1564 阅读 · 0 评论 -
数据仓库的模型
文章目录星型模型(Star Schema)雪花模型(Snowflake Schema)星座模型星型模型(Star Schema)是数据仓库的模型。当所有维度表都直接连接到事实表上时,整个图解就像星星一样,故该模型,成为星型模型,它是一种非正规化的结构,多维数据集的每个维度,都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余(冗余:数据重复,多余)主题:商品信息和商品信息有关联的信息 :1,客户信息2,订单信息3,促销信息4,厂家信息5,物流信息以商品为核心,发展的星型模型,星原创 2021-09-18 16:23:54 · 331 阅读 · 0 评论 -
事实表和维度表
文章目录表的分类事实表(动词)维度表(名词)事实表和维度表,能够描述一个完整的业务事件。例如:昨天早上张三 在某个电商平台 花费了 6000 买了一部手机。那么描述这个事件,需要三个维度,分别是时间维度(昨天早上),商家维度(电商平台),商品维度(手机)。表的分类事实表(动词)比如,整个魔方就是事实表事实表的每行数据代表一个业务事件(下单,支付,退款,评价等),这个术语表示的是业务事件的度量值(可以统计次数,个数,金额等)。维度表(名词)一般是对事实的描述信息,每一张维度表,对应现实世界原创 2021-09-18 16:21:15 · 1867 阅读 · 0 评论 -
什么是数据仓库
数据仓库是一个面向主题的,集成的,不可更新的,随时间变化的数据集合,它用于支持企业,或组织的决策分析处理。主题:用户使用数据仓库,进行决策时,所关心的重点方面,比如,商品的推荐系统,商品的推荐系统,也是基于数据仓库所做出来的系统,那么我们关心的主题,是我们商品的信息。这是数据仓库的第一层含义集成:数据仓库中的数据,来源于埋点产生的数据,Java后台的数据,爬虫数据,mysql中的数据,文本文件(csv),把不同的数据集成起来。这是数据仓库中的第二层含义不可更新的:数据仓库是为了进行决策分析所原创 2021-09-18 16:19:42 · 204 阅读 · 0 评论