数据仓库高级工程师 字节跳动面试

本人面试的是 数据仓库高级工程师–推荐系统,从官网投的校招,2020年底最后一天发的简历,元旦假三天,四号早上来了通知

以下是面试题,希望有帮助

1.自我介绍
挑重点,与面试职位无关的经历不要说,除非特别牛逼那最多一两句(托福雅思三外比赛创业国际代表),年级学校专业目标,本科做过什么科研立项什么项目,在实验室学习什么方向,自我介绍完了会让你详细说某一个做过的项目,然后细问。

2.spark与mapreduce
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。Spark 在 Scala 语言中实现,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。尽管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行。通过名为 Mesos 的第三方集群框架可以支持此行为。Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发,可用来构建大型的、低延迟的数据分析应用程序。
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)“和"Reduce(归约)”,是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。

3.jvm
JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。引入Java语言虚拟机后,Java语言在不同平台上运行时不需要重新编译。Java语言使用Java虚拟机屏蔽了与具体平台相关的信息,使得Java语言编译程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。

4.hashmap
基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。(除了非同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。 此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get 和 put)提供稳定的性能。迭代 collection 视图所需的时间与 HashMap 实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。所以,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。

hashmap的重写方法

import java.util.*;
public class Exp2 {
   
    public static void main(String[] args) {
   
        HashMap h2 = new HashMap();
        for (int i = 0; i < 10; i++) {
   
            h2.put(new Element(i), new Figureout());
            System.out.println("h2:");
            System.out.println("Get the result for Element:");
        }
        Element test = new Element(3);
        if (h2.containsKey(test)) {
   System.out.println((Figureout) h2.get(test));} 
        else {
   
            System.out.println("Not found");
        }
}
   static class Element {
   
        int number;
        public Element(int n) {
   
            number = n;
            }
}
    static class Figureout {
   
    Random r = new Random();
    boolean possible = r.nextDouble() > 0.5;
    public String toString() {
   
    if (possible) {
   
    return "OK!";
    } else {
   
    return "Impossible!";
    }
    }
}
}

5.线程与进程的关系(这题应该不是原本要问的毕竟太简单)

6.代码题:单链表去重(问设计思路、复杂度,以及要写出来运行,语言可以选)这题之前会问你熟悉的语言是什么
输入1 2 2 3 3 3 4
输出1 4

#include <stdio.h>
#include <stdlib.h>
 
/******************************************************************
*author@zs														  *
*date@2019-10-05												  *
*desc@Single linked list deduplication					  		  *
*******************************************************************/ 
 
/**自定义数据类型**/ 
typedef char Datatype; 
 
/**声明结构体**/
struct Node
{
   
	Datatype data;
	struct Node *next;
};
 
/**结构体定义**/
typedef struct Node SNode;  //结点 
typedef struct Node* SLinkNode;  //指针 
 
/**单链表初始化**/
 void InitSList(SLinkNode *head)
{
   
 	if((*head=(SLinkNode)malloc(sizeof(SNode)))==NULL)	
 	{
   
		exit(-1);  	
	}
	(*head)->next=NULL;
} 
 
/**单链表插入元素**/
int InsertSList(SLinkNode head,int i,int elem)
{
   
	SNode *pnew,*p;	
	p=head;
	int j=
  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值