- 博客(2)
- 收藏
- 关注
原创 聚类算法比较
首先是k均值算法开始,这种只能处理数值属性,其他还有k中位数和k众数算法,它的可伸缩性较好为nkt。然后为了应对k均值算法对离群点敏感问题,推出k中心算法,典型的有PAM算法,它是通过用实际对象充当代表对象,但是这样它的可伸缩性较差,需要k(n-k)。这时推出了CLARA算法,是基于数据集的抽样,这样的抽样近似于总体的分布,增强了可伸缩性。然后又推出了CLARANA算法,这种只比PAM算法多出了一个设置总阈值次数l,也就是说只输出局部最优,但是这个次数l很难确定。尽管划分方法简单,但是划分方法存在很
2022-10-18 15:55:02 128 1
原创 各种聚类算法的比较
首先是k均值算法开始,这种只能处理数值属性,其他还有k中位数和k众数算法,它的可伸缩性较好为nkt。然后为了应对k均值算法对离群点敏感问题,推出k中心算法,典型的有PAM算法,它是通过用实际对象充当代表对象,但是这样它的可伸缩性较差,需要k(n-k)。这时推出了CLARA算法,是基于数据集的抽样,这样的抽样近似于总体的分布,增强了可伸缩性。然后又推出了CLARANA算法,这种只比PAM算法多出了一个设置总阈值次数l,也就是说只输出局部最优,但是这个次数l很难确定。尽管划分方法简单,但是划分方法存在很
2022-10-18 15:43:15 492 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人