大数据基础习题,前端视频开发面试

本文涵盖了大数据基础习题,包括MapReduce的执行过程、HDFS的特性与局限性、一致性模型、数据存储和计算框架等内容。同时,文章也涉及前端视频开发面试的相关知识点,适合准备大数据和前端面试的求职者进行复习和学习。
摘要由CSDN通过智能技术生成

D. 200MB

多选:

1.MapReduce执行的全过程包括以下几个主要阶段(ABCD)

A. 从分布式文件系统读入数据

B. 执行Map任务输出中间结果

C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务

D. 执行Reduce任务得到最终结果并写入分布式系统文件

2.HDFS特殊的设计,在实现上述优良特性的同时,也使得自身具有一些应用局限性,主要包括以下几个方面 (AB)

A. A.不适合低延迟数据访问

B. B.无法高效存储大量小文件

C. C.不支持单用户写入及任意修改文件

D. D.硬件设备昂贵

3.最终一致性根据更新数据后各进程访问到数据的时间和方式的不同,可以进行区别。下列说法正确的是 ABCD

A. 因果一致性

B. 读己之所写一致性

C. 单调读一致性$会话一致性

D. 单调写一致性

4.Reduce端的Shuffle过程包括(ABD)

A. “领取”数据

B. 归并数据

C. 溢写

D. 把数据输入到Reduce任务

5.采用HDFS联邦的设计方式,可解决单名称节点以下问题(ABD)

A. HDFS集群可扩展性

B. 性能更高效

C. 单点故障问题

D. 良好的隔离性

6.MapReduce1.0架构设计具有一些很难克服的缺陷,包括(ABCD)

A. 存在单点故障

B. JobTracker“大包大揽”导致任务过重

C. 容易出现内存溢出

D. 资源划分不合理

7.三次信息化浪潮的标志有哪些(ABC)

A. 个人计算机

B. 互联网

C. 物联网,云计算和大数据

D. 人工智能

8.信息科技需要解决的核心问题包括:(ACD)

A. 信息存储

B. 信息可视

C. 信息传输

D. 信息处理

9.以下属于批处理大数据计算的产品有:(AC)

A. MapReduce

B. Storm

C. Spark

D. Pregel

10.以下属于图计算的产品有:(ABCD)

A. Pregel

B. GraphX

C. Giraph

D. PowerGraph

11.访问HBase表中的行有哪几种方式(ABD)

A. 通过单个行键

B. 行键的区间

C. 列族

D. 全表扫描

12.大数据对科学研究有哪些影响(ABCD)

A. 第一范式:实验科学

B. 第二范式:理论科学

C. 第三范式:计算科学

D. 第四范式:数据密集型科学

13.关系数据库无法满足Web2.0的需求主要表现在哪几个方面(ACD)

A. 无法满足海量数据的管理需求

B. 无法满足数据完整性

C. 无法满足数据高并发的需求

D. 无法满足高可扩展性和高可用性的需求

14.人类科学研究范式包括:(ABCD)

A. 实验

B. 理论

C. 计算

D. 数据

15.下面关于MapReduce工作流程说法正确的是(ABD)

A. 不同的Map任务之间不会进行通信。

B. 不同的Reduce任务之间也不会发生任何信息交换。

C. 用户能显式的从一台机器向另一台机器发送信息

D. 所有的数据交换都是通过MapReduce框架自身去实现的

16.与传统并行计算框架相比,以下哪些是MapReduce的优势(ABC)

A. 非共享式,容错性好

B. 普通PC机,便宜,扩展性好

C. 编程/学习难度较简单

D. 适用场景为实时、细粒度计算、计算密集型

17.Hadoop1.0的核心组件主要存在以下不足(ABCD)

A. 难以看到程序整体逻辑

B. 开发者自己管理作业之间的依赖关系

C. 执行迭代操作效率低

D. 资源浪费

18.NoSQL数据库的明显优势在于(BCD)

A. 数据的完整性

B. 可以支持超大规模数据存储

C. 灵活的数据模型

D. 强大的横向扩展能力

19.HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。总体而言,HDFS要实现以下目标: (1)兼容廉价的硬件设备 (2)流数据读写 (3)大数据集 (4)复杂的文件模型 (5)强大的跨平台兼容性 (D)

A. A.(1)(2)(3)(4)

B. B.(1)(2)(4)(5)

C. C.(2)(3)(4)(5)

D. D.(1)(2)(3)(5)

20.Map端的Shuffle过程包括以下哪几个步骤。(ABCD)

A. 输入数据和执行Map任务

B. 写入缓存

C. 溢写(分区、排序、合并)

D. 文件归并

21.MapReduce的广泛应用包括(ABCD)

A. 关系代数运算

B. 分组与聚合运算

C. 矩阵乘法

D. 矩阵-向量乘法

22.大数据处理主要包括三个类型,分别是:(ABC)。

A. 复杂的批量数据处理

B. 基于历史数据的交互式查询

C. 基于实时数据流的数据处理

D. 集成数据

23.UMP系统采用哪两种资源隔离方式(AB)

A. 用Cgroup限制MySQL进程资源

B. 在Proxy服务器端限制QPS

C. 通过MySQL实例的迁移

D. 采用资源池机制管理数据库服务器资源

24.MapReduce执行的全过程包括以下几个主要阶段(ABCD)

A. 从分布式文件系统读入数据

B. 执行Map任务输出中间结果

C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务

D. 执行Reduce任务得到最终结果并写入分布式系统文件

25.以下(ACD)产品使Hadoop功能更加完善.

A. Pig

B. QJM

C. Tez

D. Oozie

26.以下

  • 15
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值