学习笔记（二）数据仓库环境

最新推荐文章于 2024-07-20 20:04:43 发布

三米阳光

最新推荐文章于 2024-07-20 20:04:43 发布

阅读量541

点赞数

文章标签：数据仓库数据挖掘数据库存储工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sanmiyangguang/article/details/6503393

版权

探查与数据挖掘：还是对数据仓库的粒度有要求，数据仓库中经过清理的、集成的和有组织的历史数据，，为数据挖掘提供了很好的基础，

活样本数据库：就是从数据仓库中随机取出一下数据，可以定制数量，或者条件去取出一部分数据，主要是为统计数据和观察发展趋势提供数据，好处就是存储效率很高，但是要根据实际情况决定到底要不要建，对建立活样本有限制，如果不清楚限制条件请不要建，在统计学或概要生成还是很有用的。

分区设计方法：

分区是把数据分散到可独立处理的分离物理单元中去，分区分好会好处多多。。。

关键问题：如何对当前细节数据进行分区。

目的是：把数据划分成小的且可管理的物理单元，是数据管理更具灵活性。

分区标准：时间，业务范围、地理位置、组织单元。日期总是时间分区标准中的一个必然组成部分。

问题：在系统层上建分区，还是在操作层建分区。

在系统层上建立分区一定程度上是DBMS和操作系统的一种功能，在应用层上建立分区是由应用程序代码实现的，在应用层上分区更好些，可以对数据有不同的定义，重要的是当要将数据从一个处理设备转移到另一个处理设备会很容易，当工作负载和数据量成为真正的负担时，就会显现优点。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
学习笔记（二）数据仓库环境

探查与数据挖掘：还是对数据仓库的粒度有要求，数据仓库中经过清理的、集成的和有组织的历史数据，，为数据挖掘提供了很好的基础，活样本数据库：就是从数据仓库中随机取出一下数据，可以定制数量，或者条件去取出一部分数据，主要是为统计数据和观察发展趋势提供数据，好处就是存储效率很高，但是要根据实际情况决定到底要不要建，对建立活样本有限制，如果不清楚限制条件请不要建，在统计学或概要生成还是很有用的。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。