python3实现kmeans算法

1.定义计算距离的函数

def distEclud(vecA,vecB):
    # vecA,vecB是数组形式,列表形式不行
    return sum((vecA-vecB)**2)**0.5

vecA,vecB是1行n列的形式,也就是一个样本。

欧式距离的计算过程:

两数组各个元素相减,然后各个元素平方,再求和,最后取平方根

验证:

a = np.array([1,1,1])
b = np.array([1,1,1])
distEclud(a,b)
0.0

2.初始质心

采用随机质心的方式,并认为输入聚类的个数k

2.1 质心的选取,采用随机数的方式


 某一个特征的质心= 该特征所有数据的最小值 + (该特征所有数据的最大值 - 该特征所有数据的最小值)*介于0与1之间的数
 这样计算的随机质心介于该特征所有数据的最小值与最大值之间
 产生0与1之间的随机数,用random.random()函数

2.2 质心的保存形式

假设数据集m*n,m是样本个数,n是特征个数

质心用一矩阵表示,k*n的形式,k是聚类的个数,n是数据集的特征个数,也就是列的个数。

利用random()产生随机数

产生0-1之间正态分布的随机数

  • 8
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值