计算样本的最近邻聚类中心

任务描述

本关实现一个函数来计算距离每个样本最近的簇中心。

相关知识

在前一个关卡中,我们学习了欧几里得距离计算函数,对于任意两个样本,我们可以得出其距离远近。本关,我们基于这个函数,来计算距离每个样本最近的簇中心。

聚类算法中一个重要的步骤就是,来计算每个样本最近的簇中心。对于一个样本 x 和 k 个簇中心C=(C1​,C2​,…,Ck​),我们可以通过如下公式计算距离 x 最近的簇 i。

yˉ​i​=argmini​ dist(x,Ci​)

其中公式:

dist(x,Ci​)

代表样本 x 与簇中心Ci​的欧几里得距离,argmini​代表最小值所在的序号 i。

编程要求

本关卡要求你实现函数 nearest_cluster_center,在右侧编辑器 Begin-End 区间补充代码,需要填充的代码块如下:

 
  1. # -*- coding: utf-8 -*-
  2. # -*- coding: utf-8 -*-
  3. def nearest_cluster_center(x, centers):
  4. """计算各个聚类中心与输入样本最近的
  5. 参数:
  6. x - numpy数组
  7. centers - numpy二维数组
  8. 返回值:
  9. cindex - 整数,簇中心的索引值,比如3代表分配x到第3个聚类中
  10. """
  11. cindex = -1
  12. from distance import euclid_distance
  13. # 请在此添加实现代码 #
  14. #********** Begin *********#
  15. #********** End ***********#
  16. return cindex
测试说明

平台将对你的函数输入一个整数向量代表样本和一个二维数组代表一组簇向量,比对函数 nearest_cluster_center 的输出结果与正确结果的差异,只有完全正确才能进入下一关。

代码

# -*- coding: utf-8 -*-
def nearest_cluster_center(x, centers):
    """计算各个聚类中心与输入样本最近的
    参数:
        x - numpy数组
        centers - numpy二维数组
    返回值:
        cindex - 整数,类中心的索引值,比如3代表分配x到第3个聚类中
    """
    cindex = -1
    from distance import euclid_distance
    #   请在此添加实现代码     #
    #********** Begin *********#
    #计算点到各个中心的距离
    n_clusters = len(centers)
    distance_list = []
    for cluster_index in range(n_clusters):
        distance_list.append((cluster_index, euclid_distance(x, centers[cluster_index])))
    #找出最小距离的类
    distance_list = sorted(distance_list, key=lambda s:s[1])
    cindex = distance_list[0][0]
    #********** End ***********#    
    return cindex

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值