DW架构
1.对DW的认识
2.DW架构有哪几层?
3.DW的作用
数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。
Staging Area -> ODS -> Baseline ->Data Mart
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。
ODS与DM
1.什么是ODS层?
2.ODS与DW有什么区别?
3.ODS和DM有什么区别?
(Oprational Data Store)操作型数据存储,对于一些准实时的业务数据库当中的数据的暂时存储,支持一些同时关连到历史数据与实时数据分析的数据暂时存储区域,是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求,常常被作为数据仓库的过渡。即ODS只是业务数据库的一个备份或者映像,目的是为了使数据仓库的处理和决策支持要求与联机事务处理(OLTP)系统相隔离,减少决策支持要求对OLTP系统的影响。
ODS与DW比较:
数据仓库DWODS目的决策支持接近实时监控共同点整合数据整合数据面向主题面向主题不同点静态数据动态数据(延迟>24小时)(延迟>1秒)历史数据当前及历史数据概括性数据细节化数据
ODS与DM比较:
对比ODSDM数据,可变的数据,稳定的当前及历史数据历史数据业务明细的数据汇总数据/含模型结构
PL/SQL
分区
1.分区的类别?
2.分区的作用?
3.分区的索引有哪些?
Oracle 8i有两种类型分区,范围分区(Range Partition)和散列分区(Hash Partition),到Oracle 9i又增加了列表分区(List Partition)和复合分区。
分区的优点:
增强可用性:如果表的一个分区由于系统故障而不能使用,表的其余好的分区仍然可以使用;
减少关闭时间:如果系统故障只影响表的一部分分区,那么只有这部分分区需要修复,故能比整个大表修复花的时间更少;
维护轻松:如果需要重建表,独立管理每个分区比管理单个大表要轻松得多;
均衡I / O : 可以把表的不同分区分配到不同的磁盘来平衡I / O 改善性能;
改善性能:对大表的查询、增加、修改等操作可以分解到表的不同分区来并行执行,可使运行速度更快;
分区对用户透明,最终用户感觉不到分区的存在。
分区表可以创建局部索引和全局索引。当分区中出现许多事务并且要保证所有分区中的数据记录的唯一性时采用全局索引。
1.什么是物化视图?
2.物化视图的作用?
3.物化视图的定期刷新和调度有什么区别?
物化视图是用于预先计算并保存表连接或聚集等耗时较多的操作的结果物化视图存储基于远程表的数据,它是远程数据的的本地副本,或者用来生成基于数据表求和的汇总表,也可以称为快照。使用物化视图的目的是为了提高查询性能
Refresh方法
FAST增量刷新对于增量刷新选项,如果在子查询中存在分析函数,则物化视图不起作用。
COMPLETE完全刷新
FORCE:如果增量刷新可用Oracle将完成增量刷新,否则将完成完全刷新,如果不指定刷新方法(FAST,?COMPLETE,?or?FORCE),Force选项是默认选项
刷新时间START?WITH子句通知数据库完成从主表到本地表第一次复制的时间,应该及时估计下一次运行的时间点,?NEXT?子句说明了刷新的间隔时间
示例:
CREATE?MATERIALIZED?VIEW?mv_emp_pk??????????????????? ??REFRESH?FAST?????????????????? ?START?WITH?SYSDATE???????????????? ???NEXT??SYSDATE?+?2??????????????? ???WITH?PRIMARY?KEY???????????????? ???AS?SELECT?*?FROM? XXXX
分析函数
1.你接触过哪些分析函数?
2.如果有100行记录,提取period_id,合同code,amount字段,用sum(amount) over(),可以得到什么结果,有多少行?