KNN

最新推荐文章于 2024-07-13 17:09:29 发布

nyoj_lvy

最新推荐文章于 2024-07-13 17:09:29 发布

阅读量211

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/u013803499/article/details/84785618

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

from numpy import *
import operator


def create_datas():
    datasets = array([[1, 0], [0, 1], [0, 0], [1, 1], [2, 2]])
    labels = ['A', 'A', 'A', 'B', 'B']
    return datasets, labels


def KNN_algorithm(x, datas, labels, k):
    print('x=', x)
    tmp = tile(x, (datas.shape[0], 1))
    print('res=\n', tmp)
    diffMax = datas - tmp
    print('diffMax=\n', diffMax)
    powMax = diffMax ** 2
    print('powMax=\n', powMax)
    sumPowMax = powMax.sum(axis=1)
    print('sumPowMax=\n', sumPowMax)
    sqrtMax = sumPowMax ** 0.5
    print('sqrtMax=\n', sqrtMax)
    sortMat = sqrtMax.argsort()
    print('sortMat=\n', sortMat)
    countMat = {}
    for key in range(k):
        print('i = ', sortMat[key])
        print('label = ', labels[sortMat[key]])
        if labels[sortMat[key]] in countMat.keys():
            countMat[labels[sortMat[key]]] += 1
        else:
            countMat[labels[sortMat[key]]] = 1
    sortedResult = sorted(countMat.items(), key=operator.itemgetter(1), reverse=True)
    print('sortedResult=\n', sortedResult)
    return sortedResult



def domain():
    datas, labels = create_datas()
    print('datas=\n', datas)
    print('labels=', labels)
    res = KNN_algorithm([1, 2], datas, labels, 3)
    print('res = ', res[0])


if __name__ == '__main__':
    domain()

欧式距离：在这里插入图片描述