大数据面试总结


前言

大数据组件知识点整理,持续补充
loading。。。


一、Hadoop

1.简要概念

2.组件&作用

3.守护线程&作用

4.安全模式

5.HDFS优缺点

6.HDFS读写流程

7.HDFS脑裂

8.HA&Federation

9.Yarn的请求&调度

10.MapReduce的过程

11.MR的代码&如何使用

12.常用命令

13.搭建&各配置文件作用

14.遇到的问题&一些优化

1.HDFS参数调优

2.节点间数据均衡

3.基准测试

4.小文件问题

5.Hadoop宕机处理


二、Hive

1.简要概念

2.请求过程

3.语法解析过程

4.搭建

5.常用函数

6.优化

7.Load命令

8.自定义函数

9.自定义函数的使用

10.使用过程遇到什么问题,怎么解决的


三、HBase

1.简要概念


四、Zookeeper

1.简要概念


五、Flume

1.简要概念

2.组件

3.命令

4.配置文件编写

5.自定义拦截器

6.优化

1.小文件问题

2.fileChannel优化


六、Kafka

1.简要概念

2.组件

3.命令

4.Zookeeper的作用

5.Ack&Isr&HW&Leo

6.优化

1.压力测试

2.机器数量


七、Sqoop

1.简要概念

2.命令

3.参数

4.遇到的问题&处理


八、Impala

1.简要概念

2.使用需要注意什么

3.使用中和Hive有什么不一样,配合Hive使用需要注意什么


九、Azkaban

1.简要概念


十、数仓

1.分层

2.建模

3.几种类型的表

4.lambda架构&kappa架构

5.初始化&增量&全量导数


十一、Shell

1.集群启动

2.参数sh编写


十二、ELK

1.简要概念


十三、Redis

1.简要概念


十四、Spark

1.简要概念


十五、Flink

1.简要概念


总结

总结

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值