ETL
ß去掉操作型数据库中的不需要的数据
ß统一转换数据的名称和定义
ß计算汇总数据和派生数据
ß估计遗失数据的缺省值
ß调节源数据的定义变化
粒度
ß粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。
ß在数据仓库环境中粒度之所以是主要的设计问题,是因为它显著地影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答的查询类型。
ß在数据仓库中的数据量大小与查询的详细程度之间要作出权衡。
ETL
ß去掉操作型数据库中的不需要的数据
ß统一转换数据的名称和定义
ß计算汇总数据和派生数据
ß估计遗失数据的缺省值
ß调节源数据的定义变化
粒度
ß粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。
ß在数据仓库环境中粒度之所以是主要的设计问题,是因为它显著地影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答的查询类型。
ß在数据仓库中的数据量大小与查询的详细程度之间要作出权衡。