数据研发面试

阿里:

一面:

1.hive的MapReduce实现过程

2.hive中join的MapReduce过程

3.你在美团有遇到数据倾斜问题吗,如何解决的

4.实时数据如何保证容错性的

5.hashmap的实现原理

二面:

1.你在工作中如何处理数据倾斜的

2.distinct和group by的区别

3.假如group by导致数据倾斜,你怎么处理

4.hadoop和spark的区别有什么

5.spark streaming的容错机制

6.相对别人你的优势是什么

7.spark的原理

百度:

一面:

1.面向对象的特点,解释一下重写、重载、重定义

2.讲一下数据库的四种隔离级别

3.什么是幻读

4.栈有入栈和出栈,写一个函数得到栈的最大元素

5.数学题(连续3个数相乘为什么一定能被6整除)

因为连续三个数一定有一个数能被2整除,一个数能被3整除

美团:

一面:

1.TCP/IP协议

2.三次和四次握手

3.输入url后发生了什么过程

4.不用加号实现两个数相加

5.linux怎么每次读取文件的最新数据

京东:

一面:

1.传统数据仓库和数据库有什么不同

2.spark的shuffle阶段

3.你关注的新技术

4.给一个链表怎么判断他是不对称的

5.给一个数组找出等差数列的个数

6.http协议

7.websocket怎么确保获得数据的

8.查看linux后台的进程

9.linux的top命令

 

  • 5
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值