一、等间隔分类
一种数据分类方法,该方法可将一组属性值划分为组或分类间隔,以获得相等范围的值。 这种方法侧重于某个属性值与其他值的相对量。 有时称为等程间隔或等间隔。相等间隔最适用于常见的数据范围,如百分比和温度。这种方法强调的是某个属性值相对于其他值的量。
二、自然间断分级法
使用自然间断点分类 (Jenks) ,类将基于从数据中继承的自然分组。 在创建分类间隔时,应对相似值进行最恰当地分组,并使各个类之间的差异最大化。 要素将被划分为多个类,对于这些类,会在数据值的差异相对较大的位置处设置其边界。该方法不适用于数据方差很小的情况。
三、分位数分级法
把数列划分为相等个数的分段,根据实际需要选择四分位、五分位、六分位……十分位。 为此,要先将数列按大小排列,从一端开始计算其分位数,把处于分位数上的那个值作为分级值。这种方法适用于研究者对该数据集比较了解,能够找到合适的分级临界点。
四、几何间距法
用于根据具有几何系列的组距创建分类间隔。 分类器中的几何系数可以更改一次(可更改为其倒数),以便优化类范围。 该算法创建几何间隔的原理是,使每个类的元素数的平方和最小。 这可确保每个类范围与每个类所拥有的值的数量大致相同,且间隔之间的变化非常一致。该方法对于显示非正态分布的数据或当数据的分布极其倾斜时非常有用。
五、标准差分类
首先算出平均值,然后以 0.25、0.5 或 1 标准差的间隔将分类间隔放置为高于平均值和低于平均值,直到所有的数据值都包含在类之内。 超出平均值三个标准差的值会被聚合到两类,一类是高于平均值三个标准差的值,另一类是低于平均值三个标准差的值。
PS:学习总结,有不准确或不恰当的地方烦请批评指出,进行纠正修改