机器学习实战--KNN 算法笔记

最新推荐文章于 2022-05-11 14:36:37 发布

不思蜀1123

最新推荐文章于 2022-05-11 14:36:37 发布

阅读量3.5k

点赞数 4

分类专栏： Python 机器学习实战 KNN 文章标签：机器学习算法源码

本文链接：https://blog.csdn.net/qq_26101209/article/details/49704279

版权

本文介绍了K-近邻（KNN）算法的基本原理和工作方式，包括如何创建样本数据集、计算样本间的距离以及如何进行分类。通过Python代码展示了KNN算法的实现过程，包括数据预处理、归一化以及分类器的测试。在测试中，算法对于约会匹配度的预测达到了较低的错误率。

摘要由CSDN通过智能技术生成

源码部分：

from numpy import *

import operator

def createDataSet():
group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
labels=['A','A','B','B']
return group,labels
def classify0(inX,dataSet,labels,k):
dataSetSize=dataSet.shape[0]
diffMat=tile(inX,(dataSetSize,1))-dataSet
sqDiffMat=diffMat**2
sqDistances=sqDiffMat.sum(axis=1)
distances=sqDistances**0.5
sortedDisIndicies=distances.argsort()
classCount={}
for i in range(k):
voteIlabel=labels[sortedDisIndicies[i]]
classCount[voteIlabel]=classCount.get(voteIlabel,0)+1
sortedClassCount=sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)
return sortedClassCount[0][0]
def file2matrix(filename):
fr=open(filename)
arrayOLines=fr.readlines()
numberOfLines=len(arrayOLines)
returnMat=zeros((numberOfLines,3))
classLabelVector=[]
index=0
for line in arrayOLines:
line=line.strip()
listFromLine=line.split('\t')
returnMat[index,:]=listFromLine[0:3]
classLabelVector.append(int(listFromLine[-1]))
index +=1
return returnMat,classLabelVector
def autoNorm(dataSet):
minvals=dataSet.min(0)