由于过了一段时间才写这篇博客,有些题目已经记不清了,同时也没有找到相同的题目,因此只能简单描述,多见谅。
题型分布
单选题X10
不定项选择题X2
问答题X5
简答题X1
单选题
-
Hadoop HDFS Client端上传文件到HDFS上的时候下列正确的是
A. 数据经过NameNode传递给DataNode
B. 数据副本将以管道的方式依次传递
C. Client将数据写到一台DataNode上,并由Client负责完成Block复制工作
D. 当某个DataNode失败,客户端不会继续传给其它的DataNode -
在Java多线程中,下面哪种方式不会使线程进入阻塞状态()
A. sleep()
B. Suspend()
C. yield()
D. wait() -
下列说法正确的有
A. class中的constructor不可省略
B. constructor必须与class同名,但方法不能与class同名
C. constructor在一个对象被new时执行
D. 一个class只能定义一个constructor -
mapper, partitioner, combiner, shuffle的执行顺序
-
以下哪个不是Spark的组件
A. DAG Scheduler
B. Multi Scheduler
C. Task Scheduler
D. Spark Context -
下列结构中,插入性能最高的是
A. ArrayList
B. Linkedlist
C. tor
D. Collection -
以下哪些继承自 Collection 接口()
A. List
B. Set
C. Map
D. Array -
abstract方法
-
不能保证线程安全的是 volatile
-
下面哪个不属于Reducer阶段
A. Shuffle
B. Sort
C. Map
D. Reduce
多选题
-
SparkContext可以从哪些位置读取数据
A. 本地磁盘
B. web
C. hdfs
D. 内存 -
Scala语言中,一个函数可以定义在
A. Class
B. Object
C. Main
D. 构造函数
问答题
- 快速从数组中查找第K大元素
- 用MapReduce和Spark实现wordcount
- namenode HA配置
- spark中数据倾斜的问题
- spark on yarn作业执行情况,yarn-client和yarn cluster有什么区别?
简答题
- 什么是过拟合?过拟合的解决方法?过拟合在训练集和测试集中的表现。
- 简述产生过拟合的原因
- 有什么减轻过拟合的方法?