学习笔记(四)设计数据仓库

分为两部分:一操作型数据库接口的设计;二:数据仓库本身的设计

将操作型数据库中的数据导入到数据仓库中有三种情况:

1、装载档案数据

2、装载操作型系统中现有的数据

3、将上次数据库刷新以来在操作型环境中不断发生的变化,从操作型数据库中将变化的数据装载到数据仓库中。这种是最长遇到的问题也是最难的解决的,有五中办法:

3.1 扫描那些在操作环境中被钉上了时间戳的数据,当一个应用对记录的最近一次变化或更新打上时间戳时,数据仓库扫描可以有效的进行,因为当日期不符合的数据就不必处理了,但是打上时间戳的数据很少。

3.2 控制扫描数据量的技术是扫描增量文件。增量文件只包含在操作型环境中运行的事务的结果对应造成的改变,有了增量文件就会变得很高效,然而只有很少应用创建增量文件。

3.3 对事务处理的副产品产生的日志文件或审计文件进行扫描

3.4修改应用程序代码,一般很少用。

3.5 将前一个映像文件与后一个映像文件进行对比。没有办法时才会采用这种方式。

数据压缩是数据仓库数据的管理中的至关重要的内容。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值