java部分
1:Jvm调优
2:垃圾回收机制
3:多线程的几种方式及区别
4:内存池的类型及区别
5:Collection接口下面常用的子接口及实现类的特点
6:简单算法(手写冒泡,快速,选择,二分查找)
大数据部分
1:Hadoop
一,HDFS读写原理
二,HDFS各角色及作用
三,MR编程模型
四,YARN资源调度方式
2:Spark
一,详细描述Spark shuffer过程。
二,如何解决数据倾斜
三,讲述实际项目的优化方式
四,算子类型及举例
五,checkpoint作用
3:Hive
一,Hive分区,分桶,静态分区,动态分区的应用及原理
二,Hive优化
三,Hive on Spark 如何实现
四,Udf,Udaf,Udtf的原理及实现
4:Mysql
一,如何实现主从
二,什么是事务,Mysql怎样实现事务
三,索引类型及原理
四,索引结构
五,分层表,分区表使用的场景
5:Zookeeper
一,选举机制
二,数据结构及节点类型
6:Kafka
一, Ack机制
二,Kafka消息模式
三,消息的构成及顺序
7:Hbase
一,内部角色及作用
二,排序规则及什么是字典顺序
三,LSM算法及布隆过滤器
四,Hbase存储机制
8:flume
一,如何保证数据不丢失
二,flume核心及架构
9:数仓
一,简述实际项目中数仓模型的划分及考虑因素。
知道答案的小伙伴可在下方评论,后续将逐渐发布答案