本课题主要涉及以下几点: 1. 结构化数据转换为分层数据 2. 数据归一化 3. 数据集成 Inner JoinLeft outer JoinRight outer JoinFull outer JoinCartesian JoinReduce-side JoinReplicated Join 4. 聚合 5. 数据泛化 -- data generalization