自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 3、ETL数据清洗、一致化子系统

<br />此过程是ETL系统为数据增值的步骤,为业务机构提高了数据的价值。该子系统可以设计用来创建能够对源系统中的错误进行诊断的元数据,这样的诊断最终可能会导致业务过程的再设计提案,从而解决产生脏数据的根本原因,并随着时间推移而改进数据质量。<br />解决数据质量问题的技术性尝试只有成为源自机构高层的整个质量文化的一部分,才能够取得成功。<br />解决数据质量问题的九步法模板:<br />1) 宣布高层对数据质量的委托事项<br />2) 在执行层驱动业务过程重构<br />3)

2011-03-28 10:24:00 1000

原创 2、ETL抽取数据子系统

<br />1、子系统1——数据探查<br />数据探查是对数据的技术性分析。数据探查担负着战略性和战术性的任务,评估数据源是否适合于包含到数据仓库中,较早的找出那些不合格的数据源是一个责任重大的步骤;之后进行战术性的探查工作尽可能多的确定出各种问题。<br />2、子系统2——变化数据捕捉系统<br />主要目标:可以将变化的源数据分离出来进行有选择的处理,而不是进行完全更新;捕捉对源数据的所有变化,包括那些通过非标准接口对数据作出的改变;使用原因代码来区别实际的更新与错误的更正;支持对其他元

2011-03-25 10:46:00 962

原创 1、影响ETL系统设计和开发的需求

1、 ETL设计的外部约束:业务需求、源数据系统、预算、处理窗、现有职员的技能状况2、 影响ETL系统设计和开发的需求:1) 业务需求:DW/BI系统用户的信息需求,业务用户在进行业务决策的过程中所需的信息内容。2) 合规性:一般数据仓库中需要谨慎处理的需求包括,保存数据源和随后数据登台的存档副本;为改变任何数据结果的完整的事务处理流程提供证明;完整记录用于分配、调整和推到的算法;随着时间推移为数据副本的保密性提供证明,包括在线和离线两种。3) 数据质量4) 安全性:安全性要求对数据进行

2011-03-23 14:30:00 822

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除