方式一:先对于样本进行层次聚类,从而得到层次聚类结果的质心作为kmeans的质心,这是比较有效的一种选择,不过问题在于层次聚类的开销太大,因此不利于大数据的聚类。
方式二:随即选择一个点,然后以此为中心,选择离第一个点最远的点,这样可以确保散开,但是无法保证这样选中的质心位于数据密集的区域。
方式一:先对于样本进行层次聚类,从而得到层次聚类结果的质心作为kmeans的质心,这是比较有效的一种选择,不过问题在于层次聚类的开销太大,因此不利于大数据的聚类。
方式二:随即选择一个点,然后以此为中心,选择离第一个点最远的点,这样可以确保散开,但是无法保证这样选中的质心位于数据密集的区域。