K-近邻算法

最新推荐文章于 2024-08-09 17:34:06 发布

SimpleLifeT_T

最新推荐文章于 2024-08-09 17:34:06 发布

阅读量582

点赞数

分类专栏：机器学习文章标签： python k-近邻算法机器学习

本文链接：https://blog.csdn.net/qq415200973/article/details/51115458

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

K-近邻算法：

有点：精度高，对异常值不敏感，无数据输入假定。

缺点：计算复杂度高，空间复杂度高。

使用范围：数值型和标称型。

python代码：

from numpy import *

def createDataSet():
    group = array([[1.0, 1.1], [1.0, 1.0], [0.0, 0.0], [0.0, 0.1]])
    labels = ['A', 'A', 'B', 'B']
    return group, labels

def classify0(inX, dataSet, labels, k):
    dataSize = dataSet.shape[0]
    diffMat = tile(inX, (dataSize, 1)) - dataSet
    sqDiffMat = diffMat ** 2
    sqDistance = sqDiffMat.sum(axis=1)
    distance = sqDistance ** 0.5
    sortedDistIndicies = distance.argsort()
    classCount = {}
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1
    sortedClassSort = sorted(classCount.iteritems(), key=lambda x:x[1], reverse=True)
    return sortedClassSort[0][0]

SimpleLifeT_T

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
K-近邻算法

K-近邻算法：有点：精度高，对异常值不敏感，无数据输入假定。缺点：计算复杂度高，空间复杂度高。使用范围：数值型和标称型。python代码：from numpy import *def createDataSet(): group = array([[1.0, 1.1], [1.0, 1.0], [0.0, 0.0], [0.0, 0.1]]) la
复制链接

扫一扫

专栏目录