给定一个合适的类簇指标,比如平均半径或直径,
只要我们假设的类簇的数目等于或者高于真实的类簇的数目时,该指标上升会很缓慢,而一旦试图得到少于真实数目的类簇时,该指标会急剧上升。
当K取值5时,类簇指标的下降趋势最快,所以K的正确取值应该是5.
确定K个初始类簇中心点:
首先随机选择一个点作为第一个初始类簇中心点,然后选择距离该点最远的那个点作为第二个初始类簇中心点,然后再选择距离前两个点的最近距离最大的点作为第三个初始类簇的中心点,以此类推,直至选出K个初始类簇中心点。
缺点:
准确度与K值的确定和
K个初始类簇中心点选择直接相关。