Mini Batch K-Means使用详解(scikit-learn)

Mini Batch K-Means是针对大数据场景优化的K-Means算法,它通过采样数据加速计算,牺牲部分精度以换取更快的速度。在scikit-learn中,可以通过MiniBatchKMeans类实现该算法,关键参数包括batch_size、n_init等,且提供了partial_fit方法支持增量训练。
摘要由CSDN通过智能技术生成

    Mini Batch K-Means是K-Means算法的一种优化方案,主要优化了数据量大情况下的计算速度。与标准的K-Means算法相比,Mini Batch K-Means加快了计算速度,但是降低了计算精度,但是在数据量大的情况下这个精度的下降基本可以忽略。通常在数据量较大的情况下采用Mini Batch K-Means算法有更好的效果。

    Mini Batch K-Means每次迭代不采用所有样本,而是每次等量的采样,然后进行中心节点的更新。

    要使用kmeans算法的话,首先需要进行import:from sklearn.cluster import MiniBatchKMeans

    scikit-learn中,通过MiniBatchKMeans进行对象的新建,并传入算法参数进行参数设置,其中与K-Means相同的参数包括n_clusters、max_iter、tol 、init、random_state 、verbose,具体含义参考如下:

http://blog.csdn.net/qq_34104548/article/details/79336584

    其他修改或者增加的参数如下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值