- 大数据流处理技术各个的区别和联系
- 大数据批处理技术各个的区别和联系
- Hive和HBase的存储区别
- HDFS介绍、读写特性
- Elasticsearch的介绍
- ES和HDFS的区别
- HDFS HA集群搭建过吗?是个什么架构?NN只有一个吗?SNN干嘛的?能接替NN吗?
- 如果让你设计一个分布式文件系统,需要考虑什么?你的设计有什么好处,有什么缺陷?
- spark执行机制,RDD、DAG等
- 搜索引擎基本原理,倒排索引
- spark内存模型,如何解决OOM问题?如何解决SOF问题?
- HDFS DataNode死了怎么办,NameNode发生了什么变化?
- 大数据问题,10G的文件里面的数字排序
- HA HDFS Zookeeper什么作用,为什么要Zookeeper?
- Hadoop1.x和2.x之间的区别
- HBase架构,为什么其随机查询很快?
- ES如何调优?
各大公司大数据面试题
最新推荐文章于 2019-11-02 17:53:11 发布
本文涵盖了大数据面试中常见的技术问题,包括流处理与批处理的区别、Hive与HBase的存储差异、HDFS的特性和架构、Elasticsearch的原理以及与HDFS的对比。此外,还涉及Spark的执行机制、内存模型以及遇到的问题解决方案,以及Hadoop生态系统的组件、工作流程和优化策略。同时,讨论了分布式系统的基础理论如CAP,以及HBase和MySQL的比较,ES的调优和查询机制。
摘要由CSDN通过智能技术生成