具体为电信行业的例子。以用户帐单表为例一般出账时用户有很多费用客户,其数据一般存储为:时间,客户ID,费用科目,费用。这种存储结构一般称为纵表,其特点是行数多,字段少。 纵表在使用时由于行数多,统计用户数或对用户进行分档时还需要进行GROUP BY 操作,性能低,且操作不便,为提高性能,通常根据需要将纵表进行汇总,形成横表,比如:时间、客户ID,基本通话费、漫游通话费,国内长途费、国际长途费....。通常形成一个客户一行的表,这种表统计用户数或做分档统计时比较方便。另外,数据挖掘时用到的宽表一般也要求是横表结构。例如:
纵表:
FeeName FeeType FeeValue
CFee Should_Fee 10
CFee Favor_Fee -5
InfoFee Should_Fee 20
InfoFee avor_Fee 0
转换后的表结构:
FeeName Should_Fee Favor_Fee
CFee 10 -5
InfoFee 20 0