1.算法原理
ISODATA算法是在k-均值算法的基础上,增加对聚类结果的“合并”和“分裂”两个操作,并设定算法运行控制参数的一种聚类算法。
全称:Iterative Selforganizing Data Analysis Techniques Algorithm
即:迭代自组织数据分析算法
“合并”操作:
当聚类结果某一类中样本数太少,或两个类间的距离太近时,进行合并。
“分裂”操作:
当聚类结果某一类中样本某个特征类内方差太大,将该类进行分裂。
2.算法特点
使用误差平方和作为基本聚类准则
设定指标参数来决定是否进行“合并”