离散化是将连续属性的范围划分为区间。 有效的规约数据应用在例如 基于判定树的分类挖掘。 1) 离散化 通过将属性域划分为区间,减少给定连续属性值的个数。区间的标号可以代替实际的数据值。 2) 概念分层 通过使用高层的概念(比如:青年、中年、老年)来替代底层的属性值(比如:实际的年龄数据值)来规约数据