自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 聚类算法比较

首先是k均值算法开始,这种只能处理数值属性,其他还有k中位数和k众数算法,它的可伸缩性较好为nkt。然后为了应对k均值算法对离群点敏感问题,推出k中心算法,典型的有PAM算法,它是通过用实际对象充当代表对象,但是这样它的可伸缩性较差,需要k(n-k)。这时推出了CLARA算法,是基于数据集的抽样,这样的抽样近似于总体的分布,增强了可伸缩性。然后又推出了CLARANA算法,这种只比PAM算法多出了一个设置总阈值次数l,也就是说只输出局部最优,但是这个次数l很难确定。尽管划分方法简单,但是划分方法存在很

2022-10-18 15:55:02 116 1

原创 各种聚类算法的比较

首先是k均值算法开始,这种只能处理数值属性,其他还有k中位数和k众数算法,它的可伸缩性较好为nkt。然后为了应对k均值算法对离群点敏感问题,推出k中心算法,典型的有PAM算法,它是通过用实际对象充当代表对象,但是这样它的可伸缩性较差,需要k(n-k)。这时推出了CLARA算法,是基于数据集的抽样,这样的抽样近似于总体的分布,增强了可伸缩性。然后又推出了CLARANA算法,这种只比PAM算法多出了一个设置总阈值次数l,也就是说只输出局部最优,但是这个次数l很难确定。尽管划分方法简单,但是划分方法存在很

2022-10-18 15:43:15 478 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除