数据仓库笔记二

最新推荐文章于 2024-07-21 15:17:20 发布

June_Xiao

最新推荐文章于 2024-07-21 15:17:20 发布

阅读量445

点赞数

分类专栏：数据仓库与数据挖掘文章标签：数据仓库数据结构文档活动数据库算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/June_Xiao/article/details/6603145

版权

数据仓库是一个面向主题、集成的、非易失的且随时间变化的数据集合、用来支持管理人员决策。

细化程度越高，粒度级就越小；相反细化程度越低，粒度级就越大。

粒度的双重级别-轻度综合和真实档案

数据仓库最常用的数据组织形式

1、简单堆积

2、轮转综合

3、简单直接-间隔一定时间的操作类型数据的一个快照

4、连续-把一个快照追加到一个以前生成的连续文件上来创建

有三个层次的数据建模：高层建模( E R D，实体关系层)，中间层建模( D I S，数据项集)，底层建模(物理层)。

集成范围定义了数据模型的边界，而且集成范围需要在建模之前进行定义。这个范围由
系统的建模者、管理人员和最终用户共同决定。如果范围没有事先确定，建模过程就会一直
持续下去

中间层数据模型由初始数据组、二次数据组、连接件（表示主要主题域间的数据关系），数据类型组成。

公有数据在左边，独有数据在右边。

物理数据模型是由中间层数据模型创建的，它只是通过包含键码和模型的物理特性来扩展
中间层数据模型而得到的。这时，物理数据模型看上去像一系列表，这些表有时称做关系表。

在数据仓库的情况下，确定操作性能特性的第一步意味着决定数据的粒度与分割，必须
这样做。(当然，键码结构要做改变，以便能加入与每个数据单元都相关的时间元。)

由事件触发的快照有四个基本部分：
• 键码( K E Y )。
• 时间单元。
• 只和键码相关联的初始数据。
• 作为快照过程的一部分所捕获的二次数据，和初始数据或键码无直接的关系。

元数据在数据仓库的上层，并且记录数据仓库中对象的位置。典型地

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据仓库笔记二

数据仓库是一个面向主题、集成的、非易失的且随时间变化的数据集合、用来支持管理人员决策。细化程度越高，粒度级就越小；相反细化程度越低，粒度级就越大。粒度的双重级别-轻度综合和真实档案数据仓库最常用的数据组织形式1、简单堆积2、轮转综合3、简单直接-间隔一定时间的操作类型数据的一个快
复制链接

扫一扫

专栏目录

June_Xiao CSDN认证博客专家 CSDN认证企业博客

码龄18年

5: 原创

61万+: 周排名

90万+: 总排名

9065: 访问

: 等级

217: 积分

2: 粉丝

0: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

分类专栏

BC 6篇
DB2 3篇
Inno Setup
MS SQL
MYSQL 1篇
VC 2篇
数据仓库与数据挖掘 2篇

最新评论

listview加Panel
asurajordan: 你这是干神马用的
命名管道
bazzi2011: 如果AB两机器互相用命名管道通信！那么客户端的CreateFile的第一个参数【服务器主机名】怎么设置呢？填服务器IP？还是其它什么？把字符串"////.//pipe//test_pipe//"的‘.’换成什么呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。