数据仓库之拉链算法
链:古代软兵器的中介之物,故名思意.有着连接、衔接的意思.拉链算法是目前数据
仓库领域比较XX的算法之一..通用非常广.记录数
据量很大且为全量实体记录历史的操作。例如,某某移动通信公司客户资料
,以河北为例,河北有客户2800W,客户资料每个
一条就是2800W条记录算上历史客户,全量大概有5000W条左右。作为数据仓库
来存储这些信息几千万条记录不算什么。可是要
是记录历史全量所用到的存储就非常的庞大。问题实例为:一般正常情况下,从河北移动的BOSS系统
上每天采集全量的日数据大概为250
转载
2010-06-12 12:59:00 ·
2875 阅读 ·
0 评论