数据仓库与数据挖掘(二)

1、简述数据仓库的设计步骤。

数据仓库规划(用户业务目标、仓库目标)和需求分析、建模、物理模型设计、部署、维护。

 

2、简述星型模式和雪花模式的区别。

一个事实、一组维表

一个事实、维表接维表

 

3、数据仓库三种模式之间的关系。

星型、雪花、星座

 

4、在设计数据仓库时,为什么确定事实表的粒度非常重要?

事实与粒度相匹配。

 

5、以下关于数据粒度的叙述中哪些是错误。

(1)粒度是指数据仓库小数据单元的详细程度和级别。

(2)数据越详细,粒度就越小,抽象级别也就越高。

(3)数据综合度越高,粒度就越大,抽象级别也就越高。

(4)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。

 

6、以下关于数据仓库开发特点的叙述中哪些是错误的。

(1)数据仓库开发要从数据出发。

业务需求

(2)数据仓库使用的需求在开发出来后才会明确。

先明确,再开发。设计时要能够应对未来的变化。

(3)数据仓库开发一个不断循环的过程。

(4)数据仓库中数据的分析和处理十分灵活,没有固定的开发模式。

7、以下关于数据仓库设计的说法中哪些是正确的。

(1)数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计。

(2)在进行数据仓库主题数据模型设计时,应该按部门业务应用的方式来设计数据模型。

(3)在进行数据仓库主题数据模型设计时要强调数据的集成性。

(4)在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域。

8、维表中维有哪些类型?

结构维、信息维、分区维、分类维、退化维、一致维、父子维

 

9、在数据仓库的物理模型设计中,为什么要考虑维的概念分层?

多级汇总、深入洞察、不同用户不同维、灵活

10、在数据仓库的物理模型设计中,合并表组织策略有哪些好处?

节省I/O开销

 

思考:

1、源变化。

急:先处理、再分责

 

2、bottom-up/top-down

top-down:技术成熟、业务过程理解透彻。规范化程度高,最小化数据冗余与不一致性。便于全局。

周期长、见效慢;风险高。

bottom-up:见效快,投资少,灵活;由于部门需求简单,容易实现。

数据逐步清洗提炼。

转载于:https://www.cnblogs.com/moqingtong/p/8284293.html

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值