目录
转职开始做大数据了,逐步跟着学习的脚本把知识变成自己的
1.hadoop
a.HDFS分布式文件系统
b.Yarn集群资源管理器
c.MapReduce sql引擎
d.Impala sql引擎
e.工具概观
2.数据仓库知识
a.Hive数据库
1)Hive Sql
2)数据库结构
b.Doris数据库
3.混合处理框架SPARK
a.Spark
1)SCALA
b.集群架构
本机spark 通idea连接Oracle的坑-CSDN博客
4.数仓模型知识
a.分层逻辑
b.模型规范
c.指标检查
5.开发工具
a.Dbeaver
b.Idea
windows idea本地执行spark sql避坑-CSDN博客