![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
背诵
文章平均质量分 91
墨染丶eye
这个作者很懒,什么都没留下…
展开
-
维度建模——维度建模概述
维度建模是展现分析数据的首选技术。维度建模可以以商业用户可以理解的方式发布数据,并且可以提供高效地查询性能。原创 2024-07-09 13:34:00 · 917 阅读 · 0 评论 -
数据仓库——聚集
在对性能不断探索的过程中,聚集是最数据处理工具。通过仔细规划和集成,聚集将队数据仓库性能产生巨大影响。无需针对特定的软件和硬件进行大量的投资,使用在数据仓库中已经存在的工具即可。与导出模式类似,聚集是一种补充性的数据结构,用来加快工作进度。聚集主要是通过来获得改进性能的效果。但是,聚集发挥作用,需要为每个查询选择正确的聚集,还需要为聚集填充数据并确保能够与基本数据模式保持同步。理想的聚集对数仓用户是不可见的,每当需要时才默默地提供支持。原创 2024-03-31 17:59:09 · 1158 阅读 · 0 评论 -
数据仓库——特殊类型的星型模式
核心星型模式包括所有公共属性且支持跨所有类型的分析,特定类型的自定义星型模式包括所有的核心属性以及任何特定类型的属性。为了成功实现核心/自定义设计,需要使用核心维度和每个特定类型的自定义维度之间的公共属性具有一致性。有时存在自定义属性却没有自定义事实的情况,但是自定义事实表仍然可以避免分析意外。物理实现可以采用独立且不同的核心和自定义表的方式。或者使用数据库视图来实现。异构维度属性能通过设计多个维度表来处理,核心维度包含所有公共属性;自定义维度包含核心属性和特定类型的属性。原创 2024-03-31 12:42:23 · 1151 阅读 · 0 评论 -
数据仓库——事实表
累积快照事实表用来跟踪通过一系列处理步骤的个体项的进展情况,用于研究多数过程中里程碑或者事件的经过时间。事实表快照在确定的时间间隔中对问题的度量进行抽样,这样就可以容易地研究问题的度量值,而不需要聚集长期的事务历史。状态度量,通常可以从事务历史中构造出来,然而如果事务历史延伸到很远的过去,或者必须计算许多事务的状态,监控状态将是低效的办法。间隔时间的研究要求关联多个状态,在事务模型中,每个状态变化都将记录在事实表的不同行中。: 度量一系列事务的效果称为状态度量,当状态度量很重要时,事务事实表是无效率的。原创 2024-03-28 22:22:04 · 1480 阅读 · 0 评论 -
数据仓库——雪花模式以及层次递归
通常在维度中确定多重层次结构,每一个层次结构包含维度的所有属性,但将属性组织起来的方式不同。查询事实时,通过在层级的下一个级别中添加一个维度属性来完成向下钻取,上钻即通过去除当前层次结构级别的属性而开展的。可以完全不用借助层次结构来添加维度细节信息的两个特性使之成为可能,首先,属性的基数或者给定的实例值的数量,不要确定它属于那个层次结构,其次在多个双亲中能找到一些实例值。重复的属性被放置到一个单独的支架表中,该表有自己的代理键,在原始的维度中,迁移属性被替换为引用支架表的一个或多个外键。原创 2024-03-23 23:20:54 · 1425 阅读 · 0 评论 -
数据仓库——大维度问题
由于数据量很大,很多包含大维度的数据仓库功能可能会很慢,效率很低,需要设计有效的方法,原则正确索引或者采用其他优化技术处理以下问题。,历史数据库视图,创建不同的维度表视图来表示每个角色,采用适当的外键列将事实表与每个视图连接。连接选择,对于表本身来说不是问题,然而这可能导致混淆,并且可能为自动建立查询的商业智能工具带来问题。,虽然该方法解决了数据管理员提供的问题,但也带来的一系列的问题。大维度通常拥有多层次的结构,不同的业务需要的不同属性可能不同。业务过程的度量可以包含维度的多个实例。原创 2024-03-23 23:19:49 · 931 阅读 · 1 评论 -
数据仓库——维度表更新
进入维度表中的信息,在操作系统中仍有可能发生改变,在维度设计方案时,确定数据源的变化情况在维度表中如何表示非常重要,这一想想称为缓慢变化的维度,简称缓慢变化维。几乎所有的对维度表的修改都属于前两类修改,第一类是最常见的,第二类修改保留了历史数据。分析型需求偶尔需要保护其原始状态,对修改的属性,什么事情也不做。当需要支持对维度值特定时间分析,与事实无关的时采用时间戳维度。当需求冲突,需要采用多种响应方式时,采用混合技术。原创 2024-03-23 23:18:52 · 820 阅读 · 0 评论 -
数据仓库——维度表一致性
一致性矩阵可以作为实现蓝图,指明了所有事实表连接的位置,这允许独立地实现每一个事实表,并能可信地与那些已经存在的事实表协同工作。更好的描述一致性维度方式是采用矩阵图,列代表核心一致性维度,行代表不同的事实表,可通过在适当的交叉点放置检查标志来阐明一致性。一致性维度是维度建模的关键,缺乏一致性,就难以对数据仓库开展横向钻取分析,将失去协同增效的可能,并且将会形成信息孤岛。另一方面,如果在开发一致性维度集之前实现增量开发的方法,这样的框架将不可避免地陷入不一致的陷阱。原创 2024-03-23 23:18:09 · 1233 阅读 · 0 评论 -
数据仓库——维度表特性
例如考虑是否具有自然的亲和性,或者在不同环境中是否有关系,或者那些趋向于共享稳定关系的属性可能被储存在一起,或者那些仅存在事件、事务或条件等情况下相关的属性,可以将他们归入不同的事实表中,存在疑惑不定时,可以考虑不同设计方法的可浏览性。当他们的关系由事务或活动来决定,并且存在于不同的环境中,应该将他们放置在不同的维度表中。维度属性分组到维度中,用于表示引用信息的主要分类。与实体关系模型不同,维度模型不能揭示相互关联的属性之间的关系,上下文关系易于传递给事实表,而天然存在的相关性则由维度表中共存的属性表示。原创 2024-03-23 23:16:57 · 1452 阅读 · 0 评论 -
数据仓库--关系建模和维度建模
专业数据仓库面临的问题是数据仓库中数据库设计的基本模型选取问题,广泛采用的数据库设计模型有两种,关系型和多维型。原创 2024-03-11 22:29:08 · 518 阅读 · 0 评论 -
数据仓库——OLAP
联机分析处理OLAP是一种软件技术,它使分析员,经理,主管人员,能够通过快速的,一致的和交互的访问来获取并理解各种可能信息视图的数据,这些信息由原始数据转换而成,用来反映一个企业实际的维度。原创 2024-03-15 13:37:38 · 345 阅读 · 0 评论 -
数据仓库--数据
来自于企业外部系统的数据,通常是以非结构化、不可预测的格式进入企业的。原创 2024-03-10 18:06:26 · 337 阅读 · 1 评论 -
数据仓库--数据分析
指从一个汇总数据开始麻将该汇总数据分解成一组更细致的汇总数据。通过获取汇总数据下的细节数据,管理者可以知道究竟正在发生什么事,特别是汇总数据在哪里出现异常。汇总数据可能处于也可能不处于即将进行分析所需要的合适的粒度级,为了进行DSS处理,需要在数据的细节程度和对总数据之间进行权衡。汇总数据是未来分析的基础,并且由于它的存在,不必进行重复分析,应该将汇总数据作为DSS环境的主要部分。汇总数据永远是计算过程的结果,任何情况下都不存在孤立的汇总数据。DSS分析员必须取得汇总数据、理解用来产生汇总数据的过程。原创 2024-03-10 18:03:49 · 453 阅读 · 1 评论 -
数据仓库--分布式
局部系统和全局数据的需求之间映射的定义是集中式的,而不是局部的。全局数据仓库的范围是在企业级集成的业务,包含历史数据以及必须在企业级继承的信息,全局数据可能来源于操作型系统,但通常来源于局部数据仓库。就数据层来说,全局数据仓库并不符合典型的数据仓库结构,细节数据存在于分支机构,轻度综合数据存在于集中全局层。局部数据仓库包含的是在局部站点上的历史的和集成的数据,局部数据仓库间的数据或数据结构不需要协调一致。数据导入到全局数据仓库时有一个简单的数据转换。原则上局部数据应局部使用,全局数据应全局使用。原创 2024-03-10 14:09:06 · 489 阅读 · 1 评论 -
数据仓库--粒度与技术
数据仓库中数据的恰当粒度是数据开发者需要面对的一个重要的问题,粒度确定得合理,设计和实现中其余方面就可以进行得非常顺畅。原创 2024-03-09 22:52:14 · 314 阅读 · 1 评论 -
数据仓库——设计
数据仓库需求只有在已经装载部分数据并开始使用时才能弄清楚数据仓库是在启发方式下建造的。原创 2024-03-09 12:25:37 · 1007 阅读 · 1 评论 -
数据仓库——环境
数据仓库是一个面向主题的、集成的、非易失的、随时间变化的用来支持管理人员决策的数据集合。原创 2024-03-08 23:50:29 · 2345 阅读 · 3 评论 -
数据仓库——决策支持型系统
分析型环境又称决策支持系统(Decision-making Support System,DDS)信息型和决策支持型系统处理核心–数据仓库。原创 2024-03-07 07:28:23 · 611 阅读 · 1 评论 -
Java设计模式学习笔记
软件实体应当对扩展开放对修改关闭(Software entities should be open to extensions and closed to modifications)原创 2023-09-13 21:55:22 · 103 阅读 · 1 评论