Hadoop技术与应用
第五章测验
1、MapReduce的特点不包括:
易于编程
良好的扩展性
高容错性
擅长对PB级以上海量数据进行实时处理
2、MapReduce更擅长:
离线计算
实时计算
流式计算
DAG(有向图)计算
3、MapReduce中,Mapper的个数由什么决定的?
SplitInput的个数
DataNode的个数
文件切分的数据块的个数
计算机计算能力
4、Reducer的个数由什么决定的?
DataNode的个数
文件切分的数据块的个数
计算机计算能力
Partition分区的个数
5、MapTask 或ReduceTask向自己的哪个组件报告进度和状态?
ResourceManager
NodeManager
MRAppMaster
Container
6、MapReduce的Shuffle过程中哪个操作是最后做的?
合并
溢写
分区
排序
7、下面关于MapReduce的描述中正确的是?
MapReduce程序必须包含Mapper和Reducer
MapReduce程序的MapTask可以任意指定
MapReduce程序的ReduceTask可以任意指定
MapReduce程序的默认数据读取组件是TextInputFormat
8、MapReduce编程模型中以下组件哪个是最后执行的?
Mapper
Partitioner
Reducer
RecordReader
9、在MapReduce中,哪个组件如果用户不指定,则不会默认存有的?
Combiner
OutputFormat
Partitioner
InputFormat
10、下列哪种业务场景中,不能直接使用Reducer充当Combiner使用?
sum求和
avg求平均
max求最大值
count求计数
11、以下描述不正确的是?
SequenceFile可以用来作为小文件的合并存储容器
TextInputFormat的key是LongWritable类型的
TextInputFormat的key是指该记录在文件中的行号
TextInputFormat 是默认InputFormat