大数据常见面试题
一、数据分层的原则是什么?为什么这样分?每层的界限是什么?分层优点:复杂问题简单化、清晰数据结构(方便管理)、增加数据的复用性、隔离原始数据(解耦)ods 原始数据层 存放原始数据,保持原貌不做处理dwd 明细数据层 对ods层数据清洗(去除空值,脏数据,超过极限范围的数据)dws 服务数据层 轻度聚合ads 应用数据层 具体需求数仓中各层建的表都是外部表1,从对应用的支持来说,越靠上的层次,对应用越友好。比如APP层,基本是完全为应用设计。DWS层的话,相对来讲就会有一点点理解成本,





