1.ODS(**operation data store****,操作数据层**):
ODS层数据主要是,收集数据采集接口采集的原始数据,可以做简单的聚合,不做深度加工。用电信业务举例,这里的数据基本上是来自xdr和trace的数据。
2.DIM(**dimention,公共维度层**):
基于维度建模理念思想,建立整个企业的一致性维度。降低数据计算口径和算法不统一风险。公共维度层的表通常也被称为逻辑维度表,维度和维度逻辑表通常一一对应。
3.**DWD(data** **warehouse** **detail,明细数据层****)
主要对ODS层做数据清洗和规范化的操作,并且可以按照不同的行为维度对数据进行划分,即事实表。分为3种类型:
•**事务事实表。**发生在某个时间点上的一个事件,比如MR。
•**周期快照事实表。**按照规律时间间隔对事务进行度量,比如15分钟PM。
•**累计快照事实表。**涵盖一个事务或离散对象生命周期的不确定时间跨度的度量。比如呼叫话单,含有起呼时间、接听时间、终呼时间、通话时长等多个事务状态与累计度量。
这里业务上会有大宽表的说法,个人理解大宽表就是一个业务字段的汇总,一般有几百个字段,相当于是XDR和TRACE的表的数据的汇总。
4.DWS(data warehouse service,服务数据层)
对各个域进行了适度汇总,主要以数据域+业务域的理念建设公共汇总层。如天统计、栅格统计,区域统计
5.TDM(tag data model,标签层)
l面向对象建模,对跨业务板块、跨数据域的特定对象数据进行整合,通过ID-Mapping把各个业务板块、各个业务过程中的同一对象的数据打通,形成对象的全域标签体系,方便深度分析、挖掘、应用。TDM分为3种类型:
•**统计类:**统计对象相关数值,客观描述对象状态的标签,如高负荷小区近7天话务量、小区近7天弱覆盖天数。(区别于DWS层常规的天统计、月统计)
•**规则类:**根据业务运营上的需要,在业务层面制定规则的标签。如弱覆盖小区、高负荷小区、漫游用户
•**数据挖掘类:**应用算法挖掘对象相关特征。如不满意用户、私家车、快递员
6.ADS(application data store,应用数据层)
l按照业务的需要从统一数仓层、标签数据层抽取数据,并面向业务的特殊需要加工业务特定数据,以满足业务及性能需求,向特定应用组装应用数据。