超星雅尔数据挖掘基础B第二讲大数据分析处理概述

1【单选题】Mapreduce适用于( D )
A、任意应用程序
B、任意可在windows servet2008上运行的程序
C、可以串行处理的应用程序
D、可以并行处理的应用程序

2【单选题】PageRank是一个函数,它对Web中的每个网页赋予一个实数值,它的意图在于网页的PageRank越高,那么它就( D )
A、相关性越高
B、越不重要
C、相关性越低
D、越重要

3【单选题】在Bigtable中( A )主要用来存储子表数据以及一些日志文件
A、GFS
B、Chubby
C、SSTable
D、MapReduce

4【单选题】当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( B )
A、分类
B、聚类
C、关联分析
D、隐马尔可夫链

5【单选题】( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。
A、数据清洗
B、数据集成
C、数据变换
D、数据归约

6【单选题】单机串行处理1G,URL数据需要10分钟,Hadoop平台并行处理只需要1分钟,那么加速比为( A )
A、10
B、20
C、30
D、40

7【多选题】数据挖掘的主要功能包括概念描述、趋势分析、孤立点分析及( ABCD )等方面。
A、挖掘频繁模式
B、分类和预测
C、聚类分析
D、偏差分析

8【多选题】通过数据挖掘过程所推导出的关系和摘要经常被称为( AB )
A、模型
B、模式
C、模范
D、模具

9【多选题】数据挖掘的预测建模任务主要包括哪几大类问题?( AB )
A、分类
B、回归
C、模式发现
D、模式匹配

10【多选题】大数据分析处理在效果方面的评测方法为:( ABC )
A、准确率
B、召回率
C、F值
D、丢包率

11【多选题】Hadoop 集群可以运行在( ABC )3个模式。
A、单机模式
B、伪分布式模式
C、完全分布式模式
D、脱机模式

12【多选题】大数据处理的5V特点分别是( ABCD )和Value。
A、Volume
B、Velocity
C、Variety
D、Veracity

13【多选题】数据中的知识发现由以下步骤迭代序列组成是数据清理、数据集成、数据选择和( ABCD )。A、数据变换
B、数据挖掘
C、模式评估
D、知识表示

14【多选题】哪些是大数据分析处理评测方法关于效率方面的量度?(ABCD)
A、时间复杂度
B、空间复杂度
C、吞吐率
D、加速比

15【判断题】数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。正确答案:√

16【判断题】
每个map槽就是一个线程。正确答案:×

17【判断题】
聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。正确答案:√

18【判断题】
数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。正确答案:√

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值