大数据超核心面试题精华版(全会至少20K)

java部分

1:Jvm调优

2:垃圾回收机制

3:多线程的几种方式及区别

4:内存池的类型及区别

5:Collection接口下面常用的子接口及实现类的特点

6:简单算法(手写冒泡,快速,选择,二分查找)

大数据部分

1:Hadoop

一,HDFS读写原理
二,HDFS各角色及作用
三,MR编程模型
四,YARN资源调度方式

2:Spark

一,详细描述Spark shuffer过程。
二,如何解决数据倾斜
三,讲述实际项目的优化方式
四,算子类型及举例
五,checkpoint作用

3:Hive

一,Hive分区,分桶,静态分区,动态分区的应用及原理
二,Hive优化
三,Hive on Spark 如何实现
四,Udf,Udaf,Udtf的原理及实现

4:Mysql

一,如何实现主从
二,什么是事务,Mysql怎样实现事务
三,索引类型及原理
四,索引结构
五,分层表,分区表使用的场景

5:Zookeeper

一,选举机制
二,数据结构及节点类型

6:Kafka

一, Ack机制
二,Kafka消息模式
三,消息的构成及顺序

7:Hbase

一,内部角色及作用
二,排序规则及什么是字典顺序
三,LSM算法及布隆过滤器
四,Hbase存储机制

8:flume

一,如何保证数据不丢失
二,flume核心及架构

9:数仓

一,简述实际项目中数仓模型的划分及考虑因素。

知道答案的小伙伴可在下方评论,后续将逐渐发布答案

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值