本人面试的是 数据仓库高级工程师–推荐系统,从官网投的校招,2020年底最后一天发的简历,元旦假三天,四号早上来了通知
以下是面试题,希望有帮助
1.自我介绍
挑重点,与面试职位无关的经历不要说,除非特别牛逼那最多一两句(托福雅思三外比赛创业国际代表),年级学校专业目标,本科做过什么科研立项什么项目,在实验室学习什么方向,自我介绍完了会让你详细说某一个做过的项目,然后细问。
2.spark与mapreduce
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。Spark 在 Scala 语言中实现,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。尽管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行。通过名为 Mesos 的第三方集群框架可以支持此行为。Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发,可用来构建大型的、低延迟的数据分析应用程序。
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)“和"Reduce(归约)”,是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。
3.jvm
JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。引入Java语言虚拟机后,Java语言在不同平台上运行时不需要重新编译。Java语言使用Java虚拟机屏蔽了与具体平台相关的信息,使得Java语言编译程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。
4.hashmap
基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。(除了非同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。 此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get 和 put)提供稳定的性能。迭代 collection 视图所需的时间与 HashMap 实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。所以,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
hashmap的重写方法
import java.util.*;
public class Exp2 {
public static void main(String[] args) {
HashMap h2 = new HashMap();
for (int i = 0; i < 10; i++) {
h2.put(new Element(i), new Figureout());
System.out.println("h2:");
System.out.println("Get the result for Element:");
}
Element test = new Element(3);
if (h2.containsKey(test)) {
System.out.println((Figureout) h2.get(test));}
else {
System.out.println("Not found");
}
}
static class Element {
int number;
public Element(int n) {
number = n;
}
}
static class Figureout {
Random r = new Random();
boolean possible = r.nextDouble() > 0.5;
public String toString() {
if (possible) {
return "OK!";
} else {
return "Impossible!";
}
}
}
}
5.线程与进程的关系(这题应该不是原本要问的毕竟太简单)
6.代码题:单链表去重(问设计思路、复杂度,以及要写出来运行,语言可以选)这题之前会问你熟悉的语言是什么
输入1 2 2 3 3 3 4
输出1 4
#include <stdio.h>
#include <stdlib.h>
/******************************************************************
*author@zs *
*date@2019-10-05 *
*desc@Single linked list deduplication *
*******************************************************************/
/**自定义数据类型**/
typedef char Datatype;
/**声明结构体**/
struct Node
{
Datatype data;
struct Node *next;
};
/**结构体定义**/
typedef struct Node SNode; //结点
typedef struct Node* SLinkNode; //指针
/**单链表初始化**/
void InitSList(SLinkNode *head)
{
if((*head=(SLinkNode)malloc(sizeof(SNode)))==NULL)
{
exit(-1);
}
(*head)->next=NULL;
}
/**单链表插入元素**/
int InsertSList(SLinkNode head,int i,int elem)
{
SNode *pnew,*p;
p=head;
int j=