【系统分析师之路】第十五章 复盘数据库系统(数据挖掘数据仓库)
复盘数据库系统--数据挖掘数据仓库
前言部分 历年真题考点分析
1)考点分析
数据仓库和数据挖掘在这里我是把它归到了数据库系统章节,其实数据仓库也好数据挖掘也罢,它都是属于商业智能BI的。所以在企业信息化战略章节也可以看到这个知识点的影子。
这个知识点怎么考?从历年真题来看,往往是隔一或两年考查一次,考查的分值在2分左右。考查的内容和频度也是比较固定的。此外该知识点在高项和架构中也是频繁出现的考点。
2)重要知识点
1.数据仓库的概念,四个特点
2.商业智能的四个阶段
3.数据预处理的三个步骤
4.数据挖掘的四种常规方法
5.数据挖掘的常用算法
6.数据清洗的概念
7.数据归纳的概念
第一部分 综合知识历年真题
2008上综合知识历年真题(3分)
【2008上系分真题第32题:绿色】
32.(36)是一种信息分析工具,能自动地找出数据仓库中的模式及关系。
(36)
A.数据集市
B.数据挖掘
C.预测分析
D.数据统计
解答:答案选择B。
- 数据仓库是一个数据库,它存储的信息来源于企业的多个数据源,为业务用户提供了分析组织业务状态所需数据的多维视图,专为支持管理决策而设计。一般而言,数据仓库是非常庞大的数据库,包含了数以百万甚至千万计的数据记录。
- 数据集是数据仓库的一个子集,满足组织中的业务部门从事务处理系统收集来的业务数据进行联机分析的需要。数据集并不在单一的数据库中存放企业所有的数据,而是仅包含了公司业务某一方面的数据子集(如财务等),其为某特定领域提供的数据可能比数据仓库提供的更详细。
- 数据挖掘是一种信息分析工具,利用先进的统计技术及机器学习技术。在大型的数据库中发现事实。数据挖掘能够自动地找到数据仓库中的模式及关系,是决策支持解决方案的下一步发展趋势。
- 预测分析将历史数据与关于未来的假设结合起来,预测事件的结果
2009上综合知识历年真题(1分)
【2009年系分真题第30题:绿色】
30.数据仓库在收集数据过程中,会遇到一些略微不一致但可以纠正的数据,纠正的过程称为(38)。
(38)
A.数据转换
B.数据抽取
C.数据清洗
D.数据装载
解答:答案选择C。二周目红色变绿色。不过也要再看看其他三个概念。
- 数据仓库从不同的数据源提取数据,各个数据源会存在数据不一致的问题,对少量的略微不一致数据进行纠正(如对地名中的个别错别字等进行纠正),这一概念称为清洗
2013上综合知识历年真题(2分)
【2013年系分真题第19题:绿色】
19.商业智能系统主要包括数据预处理、建立数据仓库、数据分析和数据展现4个主要阶段,其中(23)是处理海量数据的基础:数据分析是体现系统智能的关键,一般采用(24)和数据挖掘技术。
(23)
A.数据预处理
B.建立数据仓库
C.数据分析
D.数据展现
(24)
A.联机分析处理
B.建立数据仓库
C.数据分析
D.数据展现
解答:答案选择B|A。二周目也是绿色。
- 商业智能系统主要包括数据预处理、建立数据仓库、数据分析和数据展现4个主要阶段。
- 数据预处理是整合企业原始数据的第一步,它包括数据的抽取、转换和加载三个过程;
- 建立数据仓库则是处理海量数据的基础;
- 数据分析是体现系统智能的关键,一般采用联机分析处理(OLAP)和数据挖掘技术。OLAP不仅进行数据汇总/聚集,同时还提供切片、切块、下钻、上卷和旋转等数据分析功能,用户可以方便地对海量数据进多维分析。数据挖掘的目标则是挖掘数据背后隐藏的知识,通过关联分析、聚类和分类等方法建立分析模型,预测企业未来发展趋势和将要面临的问题;
- 在海量数据和分析手段增多的情况下,数据展现主要保障系统分析结构的可视化
2015上综合知识历年真题(3分)
【2015年系分真题第19题:绿色】
19.采用数据仓库技术进行数据收集时,有时会遇一些略微不一致但可以纠正的数据,纠正这些数据的过程称为(23)。
(23)
A.数据转换
B.数据抽取
C.数据清洗
D.