【数据仓库与OLAP技术】期末复习+考题

疫情期间在家上网课。期末考试也和以往不同了,所以以下题目及答案仅供参考

1、请回顾自己的网课状况,回答如下问题:①是否每次都上课了?②是否每次都参与答题了?③是否有迟到、早退发生?④平均上课时间大概有多少?⑤认真听课时间平均大概有多少?⑥老师的授课内容,大概能理解和记住多少?

 ①是;②是;③否;④1h 30min;⑤1h 30min;⑥80%(然并没有)

2、你认为数据仓库和数据库在Hadoop云计算框架里的功能都是什么?是否可以不要这些部分?

        数据仓库是一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持决策。它主要功能是分析和处理数据,利用已知数据进行数据分析、数据挖掘,根据大量已知来挖掘一些有用信息或者进行预测

        数据仓库和Hadoop平台互为补充,立足于满足客户在不同使用场景下的业务需求。公有云数据仓库服务DWS能够无缝地接入到公有云Hadoop平台MRS服务上,支持SQL-over-Hadoop的这个特性,提供跨平台, 跨服务的数据共享。让用户在充分享受Hadoop带来的开放,便捷,创新的同时,继续使用熟悉的数据(仓)库方式管理和使用自己的海量数据。继续使用传统的数据仓库的上层应用,特别是商业智能BI类的应用。

        数据库是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。它的主要功能是按照数据结构来组织、存储和管理大量实时数据

        传统数据库是数据仓库和Hadoop云计算框架的基础。Hadoop用向外扩展代替数据库的向上扩展;用键/值对代替数据库的关系表;用函数式编程(MapReduce)代替数据库的声明式查询(SQL );用离线批量处理代替数据库的在线处理。

        这两部分是缺一不可的。

3、请你查阅保险业有哪些业务?你认为主管可能会对哪些分析主题感兴趣?从这些主题能抽象出哪些主题域?

(1)①人身保险业务,包括人寿保险、健康保险、意外伤害保险等保险业务;

         ②财产保险业务,包括财产损失保险、责任保险、信用保险、保证保险等保险业务;

         ③国务院保险监督管理机构批准的与保险有关的其他业务。保险人不得兼营人身保险业务和财产保险业务。但是,经营财产保险业务的保险公司经国务院保险监督管理机构批准,可以经营短期健康保险业务和意外伤害保险业务。保险公司应当在国务院保险监督管理机构依法批准的业务范围内从事保险经营活动。

(2) 在保险业系统中,数据仓库中的数据都是围绕着投保客户、保险产品这两个分析主题。

       对客户群的主题域分析,主要功能包括:客户基本情况域、客户收入域、客户风险域、客户价值域、客户行为域、客户忠诚度域等。我们必须对客户进行关注,提高其忠诚度和信誉度。

(3)对产品的主题域分析,主要功能包括:保单申请域,理赔域域,资金管理域,活动管理域。

4、假设你是中国太平保险公司的总负责人,你想了解线上业务和线下业务,不同时期,不同地区,不同险种,不同负责人,针对不同客户群体的利润差别,以及造成差别的原因。请设想会涉及到哪些维度,以及维度层次,考虑缓慢变化维的处理。请给出ROLAP实现的逻辑模型;以及MOLAP实现的物理存储方式,考虑稀疏数据的存在。

        维度:时间维、地区维、险种维、负责人维

        缓慢变化维处理:①直接覆盖,没有保留历史数据;②增加维度行 ;③增加属性列

        ROLAP实现的逻辑模型:

        虚拟OLAP,通过工具或中间软件实现多维视图的构件和存取。物理层采用关系数据库存储。对于用户来说,数据按多维方式给出。维表和事实表通过主关键字和外关键字联系在一起,形成了"星型模式。

        MOLAP实现的物理存储方式(考虑稀疏数据的存在):

        物理OLAP,基础数据和计算结果以多维方式存储在服务器。最终结果以多维视图的形式呈现给用户形成"立方块的结构。

5、假设你负责一个大型企业,急需基于数据仓库系统的多维分析,目前企业的实际状况是资金不充足。但是你发现:①多维分析的需求其实主要集中在市场营销部门和财务部门;②采购部需要经常了解企业整体运营的近期、详细情况,以便确定缺货单。请你按照这些需求,设计数据仓库的体系结构(大致包括哪些部分,每个部分实现什么功能),并给出这样设计的原因。

        ①数据源层:

            用于提供数据源,根据源数据经行分析;

            源数据如:市场营销部门资金流动记录(利于观测市场);

            财务部门工作记录(观察企业资金流动细节);

            企业库存记录(提供给采购部门所需要的信息);

            企业整体运营流水记录(根据此对公司近期进行调整);

        ②数据初步分析层:

            对数据进行初步分析,剔除无意义数据、偶然事件产生的数据,排除由于某些因素产生的无意义数据的影响;

        ③前端展示层:

            将处理完成的数据和信息进行展示、便于观测整体。

        ④数据分析及管理层:

            对初步处理完成的数据进行更加细微的处理,根据这些数据进行分析,进而产生出有价值的、可观测的数据。

 6.、请针对OLAP的6种操作,分别给出使用情境(举例)。

        切片:索尼耳机,今年二月份在中国销售情况

        切块:第三方查询网站显示的销售情况

        上卷:从去年2月份情况

        下钻:从市里情况分析省销售情况

        旋转:把行维的商品移动成列维

        横钻:对比不同立方体相同的销售数量和利润

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值