目录
0.别人经验
GitHub - GTyingzi/BigDATA: java基础、后端、大数据的面试八股
1.大数据框架
Apache Hadoop 和Hadoop生态圈 - wzzkaifa - 博客园
大数据hadoop与spark的区别 - 左手中倒影 - 博客园
知乎热议:数据仓库、数据湖、湖仓一体,究竟有什么区别?-CSDN博客
数仓事实表分类:事务事实表,周期快照事实表,累计快照事实表。_csdn 事实表划分-CSDN博客
2. HDFS
深入理解Hadoop HDFS【一篇就够】_sjmz30071360的博客-CSDN博客_hdfs
3.Mapreduce
4.Yarn
YARN资源管理UI界面详解_清平乐的技术专栏的博客-CSDN博客_yarn页面详解
5.mysql
Mysql文件存储图文详解_Mysql_脚本之家 https://www.jb51.net/article/213795.htm
6. Hive
hive 是什么_请大佬带带我的博客-CSDN博客_hive是什么
hive和mysql的区别是什么-mysql教程-PHP中文网
7.HBase
HBase的详细介绍(概念以及特性)_随风奔跑之水的博客-CSDN博客_hbase是什么
hbase与mysql的区别是什么-mysql教程-PHP中文网
HBase和HDFS的关系_zhangvalue的博客-CSDN博客_hdfs和hbase的关系
8.Spark
9.Zookper
10.调度框架
大数据调度平台oozie、azkaban、dolphinscheduler对比_老姜的数据江湖的博客-CSDN博客_dolphinscheduler oozie
11.数据同步
数据采集中间件技术对比V1.0_陈舟的舟的博客-CSDN博客_binlog采集中间件
https://www.jianshu.com/p/23ec3a386dc9
【大数据开发工程师】面试——Sqoop、Canal、Maxwell - 我的代码没有bug_zf - 博客园
12. flink
Flink快速了解(2)——3种部署模式 - NYC's Blog
Flink on Yarn的两种模式_GOD_WAR的博客-CSDN博客_flink on yarn