DAMA-CDGA认证-第11章数据仓库和商务智能

一、知识点归纳

(一)数据仓库建设的主要驱动力

        1.运营支持职能

        2.合规需求

        3.商务智能活动

(二)建设数据仓库的目标

        1.支持商务智能活动

        2.赋能商业分析和高效决策

        3.基于数据洞察寻找创新方法

(三)数据仓库建设应遵循的指导原则

        1.聚焦业务目标。确保数据仓库用于组织最优先的业务并解决问题

        2.以终为始。让业务优先级和最终交付的数据范围驱动数据仓库内容的建设

        3.全局性的思考和设计,局部性的行动和建设。让最终的愿景指导体系架构,通过集中项目快速迭代构件增量交付,从而实现耿直接的投资回报

        4.总结并持续优化,而不是一开始就这样做。以原始数据为基础,通过汇总和聚合来满足需求并确保性能,但不替换细节服务

        5.提升透明度和自助服务。上下文信息越丰富,数据消费者越能从数据中获得更多数据价值。向利益相关方公开集成的数据及其流程信息

        6.与数据仓库一起建立元数据。数据仓库成功的关键是能够准确解释数据

        7.协同。与其他数据活动协作,尤其是数据治理、数据质量和元数据管理活动

        8.不要千篇一律。为每种数据消费者提供正确的工具和产品

(四)商务智能的含义

        1.商务智能指的是一种理解组织诉求和寻找机会的数据分析活动

        2.商务智能指的是支持这类数据分析活动的技术集合

(五)数据仓库建设

        数据仓库建设指的是数据仓库中数据的抽取、清洗、转换、控制、加载等操作过程

(六)数据仓库建设的核心理念

        1.数据仓库存储的数据来自其他系统

        2.存储行为包括以提升数据价值的方式整合数据

        3.数据仓库便于数据被访问和分析

        4.组织建设数据仓库,因为它们需要让授权的利益相关方访问到可靠的、集成的数据

        5.数据仓库数据建设有很多目的,涵盖工作流支持、运营管理和预测分析

(七)数据仓库和数据集市的数据与应用程序中的数据不同

        1.数据的组织形式是按主题域而不是按功能需要

        2.数据是整合的数据,而不是孤立的烟囱数据

        3.数据是随时间变化的系列数据,而非仅当前时间的值

        4.数据再数据仓库中的延迟比在应用程序中高

        5.数据仓库中提供的历史数据比应用程序中提供的历史数据多

(八)数据集成

        数据集成包括抽取、转换和加载

(九)数据存储区域

        数据仓库包含多个不同用途的存储区域:

        1.暂存区

        2.参考数据和主数据一致性维度

        3.中央数据仓库

        4.操作型数据存储

        5.数据集市

        6.数据立方体

(十)批处理的替代方案(准实时和实时数据加载)

        1.涓流式加载(源端累积)

        2.消息传送(总线累积)

        3.流式传送(目标端累积)

(十一)确定数据加载方法时徐考虑的关键因素

        1.数据仓库和数据集市所需的延迟要求

        2.源可用性

        3.批处理窗口或上载间隔

        4.目标数据库及时间帧的一致性

        加载方法还必须解决数据质量处理过程、执行转换的时间、延迟到达的维度和数据拒绝等问题

(十二)记录的数据血缘关系的用途

        1.调查数据问题的根本原因

        2.对系统变更或数据问题进行影响分析

        3.根据数据来源确定数据的可靠性

(十三)选择数据集成工具时需考虑系统管理的功能

        1.过程审计、控制、重启和调度

        2.在执行时有选择地提取数据元素并将其传递给下游系统进行审计的能力

        3.控制哪些操作可以执行或不能执行,并重新启动哪些失败或中止的进程

(十四)商务智能工具类型

        1.运营报表

        2.业务绩效管理

        3.描述性的自主分析

(十五)常见的OLAP操作

        1.切片

        2.切块

        3.向下/向上钻取

        4.向上卷积

        5.透视

(十六)OLAP实现方法

        1.关系型联机分析处理

        2.多维矩阵型联机分析处理

        3.混合型联机分析处理

(十七)报表策略必须解决的问题

        1.安全访问

        2.描述用户交互、报告、检查或查看其数据的访问机制

        3.用户社区类型和使用它的适当工具

        4.报表摘要、详细信息、例外情况以及频率、时间、分布和存储格式的本质

        5.通过图形化输出发挥可视化功能的潜力

        6.及时性和性能之间的权衡

(十八)度量指标

        1.使用指标

        2.主题域覆盖率

        3.响应时间和性能指标

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Dear__Sky

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值