一、Hadoop
1、Hadoop相关问题汇总
- Hadoop默认不支持LZO压缩,如果需要支持LZO压缩,需要添加jar包,并在hadoop的cores-site.xml文件中添加相关压缩配置;
- Hadoop常用端口号;
- Hadoop配置文件以及简单的Hadoop集群搭建;
- HDFS读流程和写流程;
- MapReduce的Shuffle过程及Hadoop优化(包括:压缩、小文件、集群优化);
- Yarn的Job提交流程;
- Yarn的默认调度器、调度器分类、以及他们之间的区别;
- HDFS存储多目录;
- Hadoop参数调优;
- 项目经验之基准测试;
这篇博客汇总了大数据技术面试中的高频问题,涵盖了Hadoop、HDFS、MapReduce、Zookeeper、Flume、Kafka、Hive、Spark等核心技术的详细知识点,包括集群搭建、数据写入读取流程、数据倾斜处理、分布式锁、实时计算等方面,旨在帮助求职者全面准备面试。
订阅专栏 解锁全文
689

被折叠的 条评论
为什么被折叠?



