JS云:
1.说一下hbase的读写流程,借助于zookeeper实现
2.hdfs的读写流程
3.flink的原理流程,整个提交执行的流程是什么样的,其中的task和DAG图构建过程,并做了哪些优化?
4.kafka数据多副本备份过程节点挂了,怎么保证可靠性。
挂了的节点上对应的leader和follower怎么响应;
5.kafka中的优化有哪些
6.大数据的集群参与的优化有哪些?比如数据倾斜、参数调优、内部的优化有哪些
算法
7.求两个字符串中的最长的公共子串?
8.自我介绍:不好
9.自己的数据量有多大,如果数据量这么小怎么不用Java就可以搞定了?为什么还要使用分布式?
10.参数调优过重?
蓝泰源:
1.数据使用方式:更注重业务中轨迹数据
,以及轨迹数据已有的模型代码库;
2.flink相关,用的spark-streaming的用法区别?