2020Java面试大数据常见面试题+参考答案总结

本文详细介绍了Java大数据面试中关于Hadoop的相关问题,包括Hadoop的组件(如HDFS、YARN、MapReduce等)、HDFS的角色、Shuffle过程、Partition与Combine的区别、Hadoop的高可用模式以及Zookeeper在Hadoop中的作用。此外,还提及了Sqoop的底层原理和Java中抽象类的理解。同时,提到了项目面试中涉及的HBase数据存储、Hive数据读取优化以及ETL工具的使用等实战问题。
摘要由CSDN通过智能技术生成

技术面试题

1.Hadoop中有哪些组件?

Hadoop=HDFS+Yarn+MapReduce+Hive+Hbase+…

1).HDFS:分布式文件存储系统

  • 主:namenode,secondarynamenode
  • 从:datanode

2).Yarn:分布式资源管理系统,用于同一管理集群中的资源(内存等)

  • 主:ResourceManager
  • 从:NodeManager

3).MapReduce:Hadoop的计算框架,用map和reduce方式实现数据的全局汇总

4).Zookeeper:分布式协调服务,用于维护集群配置的一致性、任务提交的事物性、集群中服务的地址管理、集群管理等

  • 主:QuorumPeerMain
  • 从:QuorumPeerMain

5).Hbase:Hadoop下的分布式数据库,类似于NoSQL

  • 主:HMaster,HRegionserver,Region

7).Hive:分布式数据仓库,其实说白了就是一个数据分析工具,底层用的还是MapReduce

8).Sqoop:用于将传统数据库中数据导入到hbase或者Hdfs中一个导入工具

9).Spark:基于内存的分布式处理框架

  • 主:Master
  • 从:Worker

2.Hdfs中角色有哪些?

  • NameNode:
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值