最近做一个文本分类的项目,在最开始的时候会用到K-means的聚类方法,因此需要在文本上找到最佳的聚类数。
1. 手肘法
1.1 理论
手肘法的评价K值好坏的标准是SSE(sum of the squared errors)
SSE=∑p∈Ci|p−mi|2 S S E = ∑ p ∈ C i | p − m i | 2
其中 Ci C i 代表第 i i 个簇,
最近做一个文本分类的项目,在最开始的时候会用到K-means的聚类方法,因此需要在文本上找到最佳的聚类数。
手肘法的评价K值好坏的标准是SSE(sum of the squared errors)
SSE=∑p∈Ci|p−mi|2 S S E = ∑ p ∈ C i | p − m i | 2
其中 Ci C i 代表第 i i 个簇,