手把手教你使用KNN算法（Python实现）

最新推荐文章于 2024-05-09 19:20:18 发布

AI_Mackey

最新推荐文章于 2024-05-09 19:20:18 发布

阅读量1.4k

点赞数 1

文章标签： KNN Python

上节我们简单进行了KNN算法的说明，想想假期结束再回味一下！

Knn算法基本原理：

假设我有如下两个数据集：

 
  dataset = {
    'black':[ [1,2], [2,3], [3,1] ], 'red':[ [6,5], [7,7], [8,6] ] }

另外有一点绿颜色标记（3.5,5.3）， KNN的任务就是判断这个点(下图中的绿点)该划分到哪个组。

KNN分类算法超级简单：只需使用初中所学的两点距离公式（欧拉距离公式），计算绿点到各组的距离，看绿点和哪组更接近。K代表取离绿点最近的k个点，这k个点如果其中属于红点个数占多数，我们就认为绿点应该划分为红组，反之，则划分为黑组。如果有两组数据(如上图)，k值最小应为3（X轴坐标3.5）。

除了K-Nearest Neighbor之外还有其它分组的方法，如Radius-Based Neighbor。此方法后面在做介绍。

实现代码如下：

 
      import 
        
      math 
     
      import 
        
      numpy  
      as 
        
      np 
     
      from 
        
      matplotlib  
      import 
        
      pyplot 
     
      from 
        
      collections 
        
      import 
        
      Counter 
     
      import 
        
      warnings 
     
      # k-Nearest Neighbor算法 
     
      def 
        
      k_nearest_neighbors 
      ( 
      data 
      , 
        
      predict 
      , 
        
      k 
      = 
      5 
      ) 
      : 
     
      if 
        
      len 
      ( 
      data 
      ) 
        
      >= 
        
      k 
      : 
     
      warnings 
      . 
      warn 
      ( 
      "k is too small" 
      ) 
     
      # 计算predict点到各点的距离 
     
      distances 
        
      = 
        
      [ 
      ] 
     
      for 
        
      group  
      in 
        
      data 
      : 
     
      for 
        
      features  
      in 
        
      data 
      [ 
      group 
      ] 
      : 
     
      #euclidean_distance = np.sqrt(np.sum((np.array(features)-np.array(predict))**2))   # 计算欧拉距离，这个方法没有下面一行代码快 
     
      euclidean_distance 
        
      = 
        
      np 
      . 
      linalg 
      . 
      norm 
      ( 
      np 
      . 
      array 
      ( 
      features 
      ) 
      - 
      np 
      . 
      array 
      ( 
      predict 
      ) 
      ) 
     
      distances 
      . 
      append 
      ( 
      [ 
      euclidean_distance 
      , 
        
      group 
      ] 
      ) 
     
      sorted_distances 
        
      = 
      [ 
      i 
      [ 
      1 
      ] 
         
      for 
        
      i 
        
      in

最低0.47元/天解锁文章

AI_Mackey

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
手把手教你使用KNN算法（Python实现）

上节我们简单进行了KNN算法的说明，想想假期结束再回味一下！Knn算法基本原理：假设我有如下两个数据集：dataset = {'black':[ [1,2], [2,3], [3,1] ], 'red':[ [6,5], [7,7], [8,6] ] }另外有一点绿颜色标记（3.5,5.3），KNN的任务就是判断这个点(下图中的绿点)该划分到哪个组。KNN分类算法超级简单：只需使用初中所学的两点距...
复制链接

扫一扫