四、数据仓库中的粒度
粗略估算
估计数据仓库环境中的行数/空间大小
1. 对每一个已知的表:
计算一行所占字节数的
-最大估计值
-最小估计值
对一年内:
最大行数可能是多少?
最小行数可能是多少?
对五年内:
最大行数可能是多少?
最小行数可能是多少?
对表的每个键码:
该键码的大小(按字节)是多少?
一年总的最大空间=最大行大小×一年内最大行数
一年总的最小空间=最小行大小×一年内最小行数
累加索引空间
2. 对所有已知的表重复第1步。
双重或单一的粒度?
一年期
10 000 000 双重粒度级且认真设计
1 000 000 双重粒度级
100 000 认真设计
10 000 实际上任何设计都行
五年期
20 000 000 双重粒度级且认真设计
10 000 000 双重粒度级
1 000 000 认真设计
100 000 实际上任何设计都行
对于五年期,行的总数大致依据数量级改变。对五年以后的推测是:
■ 在管理数据仓库中的大量数据时,将有更多的专门技术可用。
■ 硬件费用有所下降。
■ 可以使用功能更强大的软件工具。
■ 最终用户更加专业化。
确定粒度的级别
粗略估算
估计数据仓库环境中的行数/空间大小
1. 对每一个已知的表:
计算一行所占字节数的
-最大估计值
-最小估计值
对一年内:
最大行数可能是多少?
最小行数可能是多少?
对五年内:
最大行数可能是多少?
最小行数可能是多少?
对表的每个键码:
该键码的大小(按字节)是多少?
一年总的最大空间=最大行大小×一年内最大行数
一年总的最小空间=最小行大小×一年内最小行数
累加索引空间
2. 对所有已知的表重复第1步。
双重或单一的粒度?
一年期
10 000 000 双重粒度级且认真设计
1 000 000 双重粒度级
100 000 认真设计
10 000 实际上任何设计都行
五年期
20 000 000 双重粒度级且认真设计
10 000 000 双重粒度级
1 000 000 认真设计
100 000 实际上任何设计都行
对于五年期,行的总数大致依据数量级改变。对五年以后的推测是:
■ 在管理数据仓库中的大量数据时,将有更多的专门技术可用。
■ 硬件费用有所下降。
■ 可以使用功能更强大的软件工具。
■ 最终用户更加专业化。
确定粒度的级别