学习笔记(二)数据仓库环境

  探查与数据挖掘:还是对数据仓库的粒度有要求,数据仓库中经过清理的、集成的和有组织的历史数据,,为数据挖掘提供了很好的基础,

活样本数据库:就是从数据仓库中随机取出一下数据,可以定制数量,或者条件去取出一部分数据,主要是为统计数据和观察发展趋势提供数据,好处就是存储效率很高,但是要根据实际情况决定到底要不要建,对建立活样本有限制,如果不清楚限制条件请不要建,在统计学或概要生成还是很有用的。

分区设计方法

分区是把数据分散到可独立处理的分离物理单元中去,分区分好会好处多多。。。

关键问题:如何对当前细节数据进行分区。

目的是:把数据划分成小的且可管理的物理单元,是数据管理更具灵活性。

分区标准:时间,业务范围、地理位置、组织单元。日期总是时间分区标准中的一个必然组成部分。

问题:在系统层上建分区,还是在操作层建分区。

在系统层上建立分区一定程度上是DBMS和操作系统的一种功能,在应用层上建立分区是由应用程序代码实现的,在应用层上分区更好些,可以对数据有不同的定义,重要的是当要将数据从一个处理设备转移到另一个处理设备会很容易,当工作负载和数据量成为真正的负担时,就会显现优点。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值