大数据平台建设后,数据经过初步的清洗、简单加工进入到贴源层,面对这些数据,如何在贴源层之上的基础层构建主题模型是需要思考的一个课题。清晰的数据结构可以在使用表的时候能更方便地定位和理解,规范数据分层,开发一些通用的中间层数据,比如汇总层数据,满足不同业务取数要求,能够减少极大的重复计算;通过针对原始数据的一些预处理(缺失值、噪声等处理)屏蔽原始数据的异常。
针对这块,可以说我还是个小白,故自己查阅了一些网上资料并做了总结,记录在这里。
- 通用金融行业主题域模型设计原则:
1、是对商业模型的抽象;
2、以商业模式中关注的对象为划分依据;
3、内容完整且相对稳定;
4、每个主题域下一般都有一个与之同名的主实体,围绕该主实体展开各种关系实体及父子实体。
- NCR金融数据模型
NCR FS-LDM数据模型可以说是金融行业事实上的工业标准。
- 支付宝
支付宝基于IBM 的FSDM的九大数据概念进行客户化,如下图所示:
- 结语
- 结语
数据仓库的分层可以算是数据仓库架构的子话题。从目前来看,还没有非常统一的分层方法,其中,Inmon和Kimball是最具代表性的两种分层方法。
在I