常见bigdata面试问题总结

JS云:
1.说一下hbase的读写流程,借助于zookeeper实现
2.hdfs的读写流程
3.flink的原理流程,整个提交执行的流程是什么样的,其中的task和DAG图构建过程,并做了哪些优化?
4.kafka数据多副本备份过程节点挂了,怎么保证可靠性。
挂了的节点上对应的leader和follower怎么响应;

5.kafka中的优化有哪些
6.大数据的集群参与的优化有哪些?比如数据倾斜、参数调优、内部的优化有哪些

算法
7.求两个字符串中的最长的公共子串?
8.自我介绍:不好
9.自己的数据量有多大,如果数据量这么小怎么不用Java就可以搞定了?为什么还要使用分布式?
10.参数调优过重?

蓝泰源:
1.数据使用方式:更注重业务中轨迹数据
,以及轨迹数据已有的模型代码库;
2.flink相关,用的spark-streaming的用法区别?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值