python sklearn库中的AffinityPropagation( )聚类算法主要参数的使用,

本文介绍了Python机器学习库sklearn中的AffinityPropagation聚类算法,包括其主要参数如damping、max_iter、convergence_iter等的作用。通过实例展示了如何使用该算法进行数据聚类,并解释了聚类中心的确定和算法复杂度。
摘要由CSDN通过智能技术生成

class sklearn.cluster.AffinityPropagation(damping=0.5, max_iter=200, convergence_iter=15, copy=True, preference=None, affinity=’euclidean’, verbose=False)

函数参数

    damping : float, optional, default: 0.5,阻尼系数,默认值0.5

    max_iter : int, optional, default: 200,最大迭代次数,默认值是200

    convergence_iter : int, optional, default: 15,在停止收敛的估计集群数量上没有变化的迭代次数。默认15

    copy : boolean, optional, default: True,布尔值,可选,默认为true,即允许对输入数据的复制

    preference : array-like, shape (n_samples,) or float, optional,近似数组,每个点的偏好 - 具有较大偏好值的点更可能被选为聚类的中心点。 簇的数量,即集群的数量受输入偏好值的影响。 如果该项未作为参数,则选择输入相似度的中位数作为偏好

    affinity : string, optional, default=``euclidean``目前支持计算预欧几里得距离。 即点之间的负平方欧氏距离。

AP聚类(Affinity Propagation Clustering)是一种基于图论的聚类算法,可以自动决定数据集中的聚类数目。它不需要指定聚类的数量,而是通过样本自身的相似性来确定聚类的个数和每个样本所属的类别。 下面给出一个用 Python 实现 AP 聚类的例子: ```python from sklearn.cluster import AffinityPropagation from sklearn import metrics from sklearn.datasets import make_blobs # 生成样本数据 centers = [[1, 1], [-1, -1], [1, -1]] X, labels_true = make_blobs(n_samples=300, centers=centers, cluster_std=0.5, random_state=0) # 计算相似度矩阵 af = AffinityPropagation().fit(X) cluster_centers_indices = af.cluster_centers_indices_ labels = af.labels_ n_clusters_ = len(cluster_centers_indices) # 输出聚类结果 print('Estimated number of clusters: %d' % n_clusters_) print("Homogeneity: %0.3f" % metrics.homogeneity_score(labels_true, labels)) print("Completeness: %0.3f" % metrics.completeness_score(labels_true, labels)) print("V-measure: %0.3f" % metrics.v_measure_score(labels_true, labels)) print("Adjusted Rand Index: %0.3f" % metrics.adjusted_rand_score(labels_true, labels)) print("Adjusted Mutual Information: %0.3f" % metrics.adjusted_mutual_info_score(labels_true, labels)) ``` 在上述代码中,我们使用了 `make_blobs()` 生成了一个三类数据集,然后使用 `AffinityPropagation()` 计算相似度矩阵并进行聚类,最后输出了聚类结果和聚类评估指标。 需要注意的是,AP 聚类算法的时间复杂度较高,因此对于大规模数据集可能不太适用。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值