The Data Warehouse ETL Toolkit-需求

业务方面的需求始终是更基础的和更重要的部分。

        (一)业务需求

业务需求是数据仓库最终用户的信息需求。

业务需求直接决定了数据源的选择。

ETL小组的核心工作就是不断地理解和检验业务需求。

业务需求和数据源的内容都是不断变化的,需要不断地进行检验和讨论。

(二)合规需求(Compliance requirements

法律、法规相关要求。

(三)数据评估

数据评估是设计任何数据使用系统的前提。

Jack Olson:“数据评估使用分析方法来检查数据,充分了解数据的内容、结构和质量。好的数据评估能够处理海量数据,使用分析方法找到需要解决的全部问题。”

(四)安全需求

最终用户的安全授权不是在数据仓库的物理表一级,各应用系统的用户安全定义都在各自的应用系统中进行授权。

(五)数据集成

360度的业务视图”就是对数据集成的业务解释。(The 360 degree view of the business is the business name for data integration.

数据集成采用规格化的维表和事实表,规格化的维表是指在分离的数据库中建设立公共维度实体,以便于构建横向钻取型报表;规格化的事实表意味着在分离的数据库中建立公共业务度量,以便于通过差值和比率对这些数值进行比较。

数据集成在ETL系统中是数据流程中的一个独立步骤,叫做规格化步骤。

(六)数据延迟

数据延迟需求用于描述数据提交到最终用户的速度。

数据延迟对系统的实施和架构有巨大的影响。

面向批处理架构与面向流的架构。

(七)数据归档和数据线性化

抽取、清洗、转换、提交四个主要的转换发生时均要集结数据并进行归档,每个归档数据都应当有与之相对的元数据。

对于合规需求(Compliance requirements)而言,追踪记录所有的数据沿袭是严格必要的,应当成为每次归档流程的一部分。

(八)最终用户提交界面

ETL小组、数据建模人员、应用开发人员、最终用户需要紧密配合,开发针对详细需求的数据模型及应用。

(九)可用的技能

建立ETL系统时,重要的设计方面的决定必须由那些创建和管理系统的人做出。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/16239395/viewspace-764422/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/16239395/viewspace-764422/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值