加粗样式@TOC
数据仓库的建模目标
1.访问性能
能够快速查询所需要的数据,减少数据I/O。
2.数据成本
减少不必要的数据冗余,实现计算结构复用,降低大数据系统中的存储成本和计算成本。
3.使用效率
改善用户应用体验,提高使用数据的效率
在图书管里面一个很好的图书的索引,就能提高用户的使用效率,就可以准确快速的
定位到想看的数据,想看的书,想看的数据的类别
4.数据质量
改善数据统计口径的不一致性,减少数据计算的错误的可能性,提供高质量的。一致的数据访问平台
数据仓库所有的数据源来自很多源系统,各个系统,除了关系型数据库之外还有很多的日志,像用户
行为的日志,数据库的blog,还有好多智能终端的传感器数据,这些数据质量都是参差不齐的,
所以我们构建数据仓库非常重要的一个目的就是数据质量。能够整合所有数据源的数据,同时提供高质
量的数据服务出口。
这个是我们来构建数据仓库建模的目的,同时如果你把一个数据仓库建模做的很好,合理的场景选择出
合理的建模方法,能够使我们的数据仓库有很好的访问性能,同时降低数据的成本,改善用户的使用效率,
另外就是数据质量。数据质量是所有数仓项目最重要的一部分,数仓无论建的有多么的完善,模型设计的
多么的易扩展,多么的灵活,但是数据质量如果差,那么一切都没有用。因为无论是分析师,或者做数据
风控算法的工程师,就是无论算法多么的精准,如果用的垃圾数据来建模,最终的结果都是不可控的。