![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据技术原理与应用(期末复习)
文章平均质量分 66
lalalabibobi
是的,我确实很懒,但懒并不代表就不写个人简介
展开
-
MapReduce理论测试题
C MapReduce过程中Map阶段每个Map任务的输出结果默认不是按照key排序的,需进一步编程进行排序。B MapReduce计算过程中,相同的key默认会被发送到同一个reduce task处理。C Value类必须实现WritableComparable。A MapReduce适于PB级别以上的海量数据在线处理。D MapReduce隐藏了并行计算的细节,方便使用。B 文件切分的数据块个数C 计算机计算能力。C 将申请的资源分配给内部任务。C 将申请的资源分配给内部任务。原创 2023-12-25 20:53:33 · 1213 阅读 · 0 评论 -
HBase理论测试题(大数据系统与平台技术)
每个Store并不只保存一个Column,实际上,它可以保存多个列族(Column Family),每个列族下又可以包含多个列限定符(Column Qualifier)。因此,每个Store可以保存多个列族和对应的列限定符。HBase并不支持传统数据库中的复合索引方式,它采用单一的行键(Row Key)进行数据存储和检索。A 每个Strore由一个MemStore和多个StoreFile组成。C MemStore存储在内存中,StoreFile存储在HDFS。2.下面对HBase的描述哪些是正确的?原创 2023-12-25 00:48:19 · 1120 阅读 · 0 评论 -
HDFS JAVA API编程(1)
这些代码分别用于创建本地文件对象、HDFS目标目录路径对象、HDFS文件路径对象、本地文件输入流、在HDFS上创建输出流以及进行文件内容复制。这些代码分别用于创建HDFS文件路径对象、本地目标文件对象、打开HDFS文件输入流、创建本地文件输出流以及进行文件内容复制。然后通过一系列的条件判断,检查本地文件和HDFS目录的状态,以确定是否可以进行文件复制操作。然后通过一系列的条件判断,检查HDFS文件的状态,以确定是否可以进行文件获取操作。将本地文件内容复制到HDFS文件。将HDFS文件内容复制到本地文件。原创 2023-12-24 16:41:45 · 705 阅读 · 0 评论 -
大数据概述测试题
B 用户离散的交互痕迹能够为企业提升服务质量提供参考。A 网络公司能够捕捉到用户在其网站上的所有行为。A 物联网可以借助于云计算实现海量数据的存储。C 物联网可以借助于大数据实现海量数据的分析。C Spark只能运行在Hadoop上。D 用户的隐私安全很难得以规范保护。Spark用于分布式存储数A 据。B Spark基于内存处理数据。D Spark基于硬盘处理数据。A 采集-清洗-挖掘-统计。B 采集-清洗-统计-挖掘。C 采集-挖掘-清洗-统计。D 采集-统计-清洗-挖掘。C 数字轨迹用完即自动删除。原创 2023-12-24 01:38:28 · 685 阅读 · 0 评论 -
Hive理论测试题
A.Hive支持自由的扩展集群的规模,只需要重启服务即可。B.Hive支持自定义函数用户可根据自己的需求去定义函数。C.Hive sQL执行时需要避免节点出现问题。D.Hive适合处理小批量数据。原创 2023-12-18 16:10:57 · 544 阅读 · 1 评论 -
HDFS理论测试题(大数据技术原理与应用期末复习期末复习)
中选择,填写正确答案的编号。中选择,填写正确答案的编号。答案在A、namenode。答案在A、namenode。原创 2023-12-18 15:33:04 · 1092 阅读 · 1 评论