数据仓库建模目标
1、访问性能
能够快速查询需要的数据,减少数据I/O;
构建数据仓库不只是为了集成数据,而集成数据讲究的是一个方法。集成数据的同时要考察的是一个快速查询出需要的数据,有效减少使用数据时带来的磁盘IO。
2、数据成本
减少不必要的数据冗余,实现计算结果数据复用,降低大数据系统中的存储成本和计算成本;
基于大数据的仓库建模,数据量是偏大的。所以,我们需要考虑数据成本。存储成本、计算成本,还有用户使用的成本。
3、使用效率
改善用户体验,提高使用数据的效率;
4、数据质量
改善数据统计口径的不一致性,减少数据计算错误的可能性,提高高质量的、一致的数据访问平台。
所以,大数据的数仓建模需要通过建模的方法更好的组织、存储数据,以便在性能、成本、效率和数据质量之间找到最佳的平衡点。