连续属性离散化的直观含义是:首先为被离散的连续属性选定离散值数目,寻找一些划分点把连续属性的连续取值范围划分成一些子区间,每个子区间对应于一个离散值,这样就可以用一些离散的取值点来表示这个连续属性的整个取值范围。
    对于数据库中的任意一个连续属性,将它的取值范围划分为若干区间,每个区间至少包含一个样本。m个样本至多分成m个区间。这样,可将连续属性变量转换成具有m个值的离散变量。