class sklearn.cluster.Birch(threshold = 0.5,branching_factor = 50,n_clusters = 3,compute_labels = True,copy = True )
参数: | threshold:float,默认值为 0.5
通过合并新样本和最近的子集群获得的子集群的半径应小于阈值。否则,将启动新的子集群。
branching_factor:int,默认值为50
每个节点中的最大CF子集群数。如果输入新样本使得子集群的数量超过branching_factor,则必须拆分该节点。必须拆分相应的父级,如果父级中的子子集数大于分支因子,则必须递归拆分。
n_clusters:int,sklearn.cluster模型的实例,默认为None
最终聚类步骤之后的聚类数,它将叶子中的子聚类视为新样本。默认情况下,不执行此最终聚类步骤,并按原样返回子聚类。如果提供了模型,则模型适合将子集视为新样本,并将初始数据映射到最近的子集群的标签。如果提供了int,则模型拟合为AgglomerativeClustering,其中n_clusters设置为int。
compute_labels:bool,默认为True
是否为每个拟合计算标签。
copy:bool,默认为True
是否复制给定数据。如果设置为False,则将覆盖初始数据。
|
---|