2021唯品会秋招数据开发岗笔试题

2021唯品会秋招数据开发岗笔试题

由于过了一段时间才写这篇博客,有些题目已经记不清了,同时也没有找到相同的题目,因此只能简单描述,多见谅。

题型分布

单选题X10
不定项选择题X2
问答题X5
简答题X1

单选题

  1. Hadoop HDFS Client端上传文件到HDFS上的时候下列正确的是
    A. 数据经过NameNode传递给DataNode
    B. 数据副本将以管道的方式依次传递
    C. Client将数据写到一台DataNode上,并由Client负责完成Block复制工作
    D. 当某个DataNode失败,客户端不会继续传给其它的DataNode

  2. 在Java多线程中,下面哪种方式不会使线程进入阻塞状态()
    A. sleep()
    B. Suspend()
    C. yield()
    D. wait()

  3. 下列说法正确的有
    A. class中的constructor不可省略
    B. constructor必须与class同名,但方法不能与class同名
    C. constructor在一个对象被new时执行
    D. 一个class只能定义一个constructor

  4. mapper, partitioner, combiner, shuffle的执行顺序

  5. 以下哪个不是Spark的组件
    A. DAG Scheduler
    B. Multi Scheduler
    C. Task Scheduler
    D. Spark Context

  6. 下列结构中,插入性能最高的是
    A. ArrayList
    B. Linkedlist
    C. tor
    D. Collection

  7. 以下哪些继承自 Collection 接口()
    A. List
    B. Set
    C. Map
    D. Array

  8. abstract方法

  9. 不能保证线程安全的是 volatile

  10. 下面哪个不属于Reducer阶段
    A. Shuffle
    B. Sort
    C. Map
    D. Reduce

多选题

  1. SparkContext可以从哪些位置读取数据
    A. 本地磁盘
    B. web
    C. hdfs
    D. 内存

  2. Scala语言中,一个函数可以定义在
    A. Class
    B. Object
    C. Main
    D. 构造函数

问答题

  1. 快速从数组中查找第K大元素
  2. 用MapReduce和Spark实现wordcount
  3. namenode HA配置
  4. spark中数据倾斜的问题
  5. spark on yarn作业执行情况,yarn-client和yarn cluster有什么区别?

简答题

  1. 什么是过拟合?过拟合的解决方法?过拟合在训练集和测试集中的表现。
  2. 简述产生过拟合的原因
  3. 有什么减轻过拟合的方法?
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值