程序给出了k-means的用法和简单的pandas操作excel
1.选择一个参数k,也就是聚类时分成几类
2,随机选择k个中心点
3,计算每个样本到中心的距离,把这个样本归为与中心距离最近的那一类
4,更新中心
5,重复3,4步。达到最大迭代次数或者中心不发生变化,重复结束
距离公式:
首先help(np.linalg.norm)
查看其文档:
norm(x, ord=None, axis=None, keepdims=False)
- 1
参数 | 说明 | 计算方法 |
---|---|---|
默认 | 二范数:ℓ2 | x21+x2 |