- 博客(1)
- 收藏
- 关注
原创 讲解机器学习中的 K-均值聚类算法及其有缺点
2.计算速度较快:K-均值算法的计算时间复杂度为O(tkn),其中t代表迭代次数,k代表簇数,n代表数据集中的点数。1.对初始值敏感:簇的初始中心的选择会影响聚类结果,如果初始值不好,将可能得到一个较差的聚类结果,因此需要采用一些特殊的方法来选择初始簇中心,比如随机选择多个点,多次执行算法,选取最优结果等。3.不适用于处理大量的高维数据:当数据集有很多特征时,K-均值算法可能会失效,因为高维数据往往呈现出稀疏性(即大部分特征值为0),导致两个数据点看起来很相似,但实际上它们之间的距离很远。
2023-08-30 09:39:46 188
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人