(1)获得一个数据模型
(2)定义记录系统,也就是找到最符合数据模型需求的数据。记录系统是数据仓库模型的数据源。然后,需要寻找将记录系统中的数据迁移到数据仓库中可能面临的技术挑战。包括1)DBMS的变化 2)操作系统的变化 3)需要将源自不同DBMS和操作系统的数据合并起来 4)基本数据格式的变化
(3)设计数据仓库,主要工作有,1)清除纯操作性数据 2)做数据稳定性分析,将经常变动的数据和比较稳定的数据分开存放于不同的物理结构中。3)按主题域进行组织等。
(4)设计和建立记录系统和数据仓库之间的接口(数据抽取+数据集成),可以用ETL软件建立和维护这种接口。
(5)载入第一个主题域
[@more@]来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/24214296/viewspace-1056103/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/24214296/viewspace-1056103/