K近邻法

最新推荐文章于 2024-03-12 21:10:27 发布

bobomain123

最新推荐文章于 2024-03-12 21:10:27 发布

阅读量123

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/noob_bobo/article/details/89401983

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

k近邻法：为新的输入在数据集中找到与该实例距离最短的k个实例，这k个实例的多数属于某个类，则把该实例归入到该类中（“多数表决”规则）

常用“欧式距离”度量实例间的距离
使用“交叉验证”的方法选取合适的k值
为了保证每个数值的同等重要性，对每个特征进行归一化

算法实现

#-*-coding:utf-8 -*-
import numpy as np
import math

#训练集和类别
def creatDataSet( ):
    group = np.array([[1.0,2.0],[1.2,0.1],[0.1,1.4],[0.3,3.5]])
    label = ['A','A','B','B']
    return group,label

#确定输入实例以及k值
def inputData( ):
    test_data=np.array([ [1.1 , 0.3] ])
    K = 3
    return test_data,K

#归一化
def Normalization( group ):
    max = np.amax(group,axis=0)
    min = np.amin(group,axis=0)
    for i in range(len(group)):
        group[i][0] /= (max[ 0 ] - min[ 0 ])
        group[i][1] /= (max[ 1 ] - min[ 1 ])
    return group

#求输入实例与训练集中所有点的欧氏距离
def Distance( group ,dis ):
    test,K=inputData( )
    group = Normalization( group )
    for i in range(len(dis)):
        dis[i] = math.sqrt((group[i][0] - test[0][0]) ** 2 + (group[i][1] - test[0][1]) ** 2 )
    return dis,K,test

#找出输入实例的类别
def Classify_By_KNN( group , label ):
    size = len( label )
    dis = np.zeros( size )
    dis,k,test = Distance( group ,dis )
    sortedDistIndex=np.argsort(dis)
    countLabel={}
    for i in range(k):
        l=label[sortedDistIndex[i]]
        countLabel[l] = countLabel.get(l,0) + 1
    countMax=max(countLabel.values())
    for key,value in countLabel.items():
        if value == countMax:
            print("测试数据为:",test,"   分类结果为：",key)
    
g,l=creatDataSet( )
Classify_By_KNN( g , l )

运行结果：
在这里插入图片描述
参考文献：

《统计学习方法》李航
知乎：一文搞懂k近邻算法

https://zhuanlan.zhihu.com/p/25994179

https://zhuanlan.zhihu.com/p/26029567

bobomain123

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
K近邻法

k近邻法：为新的输入在数据集中找到与该实例距离最短的k个实例，这k个实例的多数属于某个类，则把该实例归入到该类中（“多数表决”规则）常用“欧式距离”度量实例间的距离使用“交叉验证”的方法选取合适的k值为了保证每个数值的同等重要性，对每个特征进行归一化算法实现#-*-coding:utf-8 -*-import numpy as npimport math#训练集和类别def...
复制链接

扫一扫

专栏目录