大数据面试题(校招)
项目1.介绍电商数仓项目2.在项目中用的什么数据栈?3.数据仓库建模几种方式4.讲一下维度建模,维度表5.数据倾斜6.提到了map_join代替普通join,面试官问为什么map_join能解决数据倾斜,具体流程怎样7.数据缺失值处理8.数仓分层(各层作用)9.数仓建设的理论(哪两种)为什么用这种?10.星型模型和雪花模型介绍,各自的适合什么样的数据场景11.数仓建设的原理12.为什么会发生数据倾斜,怎么解决13.什么是事务hadoop1.mapreduce的几部分2.map





