DAMA-CDGA 练习题 - 第14章 大数据和数据科学

1、以下选项中不属于数据挖掘经常使用的技术是: (知识点: 第十四
章 大数据与数据科学)
A.剖析(Profiling)
B.向上卷积(Roll-up)
C.数据缩减(Data reduction)
D.自组织映射(Self-organizing maps)
参考答案 : B
题目解析 : DMBOK2 第 14 章 14.1.3-10
2、ETL 的作用主要体现在: (知识点: 第十四章 大数据与数据科学)
A.构建数据集市
B.管理数据仓库
C.把数据转换为信息、知识
D.数据库数据存储
参考答案 : C
题目解析 : DMBOK2 第 14 章 14.1
3、关于数据仓库和数据湖的主要差别,以下哪项描述是不正确的。
(知识点: 第十四章 大数据与数据科学)
A.存储数据类型和数据结构化流程不同
B.主要提供的服务不同
C.面向主要用户不同 D.应用侧重点不同
参考答案 : C
题目解析 : 第十一章 PPT-P16:面向数据科学家、数据开发人员和
业务分析师
4、定义大数据战略和业务需求,应该考虑提供数据的及时性和范围,
许多元素可以实施提供,也可以定时提供快照,甚至可以整合和汇总,
其中流式计算越来越成为热点,以下不属于流式计算框架的是: (知
识点: 第十四章 大数据与数据科学)
A.Strom
B.Flink
C.Hadoop
D.Spark
参考答案 : C
题目解析 : DMBOK2 第 14 章 14.2.1
5、MapReduce 模型有三个主要步骤: (知识点: 第十四章 大数据
与数据科学)
A.剖析、关联、聚类
B.提取、转换、加载
C.映射、修正、转换
D.映射、洗牌、归并
参考答案 : D
题目解析 : DMBOK2 第 14 章 14.3.2 6、从大量非结构化或半结构化数据中检索并获得见解的自动化方法,
用于感知人们对品牌、产品、服务或其他类型主题的感觉和看法,这
种方法是指: (知识点: 第十四章 大数据与数据科学)
A.语义分析
B.机器学习
C.预测分析
D.文本挖掘
参考答案 : A
题目解析 : DMBOK2 第 14 章 14.1.3-9
7、某企业反映其数据库响应时间太慢,虽然增加了计算平台投入,
仍然要花费数小时甚至好几天才能完成某项大规模表的计算,对此,
你应该推荐该企业使用如下哪种工具或技术予以改善: (知识点: 第
十四章 大数据与数据科学)
A.ERP
  • 9
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值