knn python_KNN Python实现

weixin_39630735

于 2021-01-15 03:11:59 发布

阅读量118

点赞数

文章标签： knn python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39630735/article/details/112991400

版权

本文详细介绍了k近邻(kNN)算法的基本原理，包括其在分类和回归问题中的应用。通过实例展示了如何实现一个简单的kNN分类器，并使用鸢尾花数据集进行了验证。同时，对比了自定义实现与sklearn库中的kNN分类器的性能。

摘要由CSDN通过智能技术生成

'''

k近邻(kNN)算法的工作机制比较简单，根据某种距离测度找出距离给定待测样本距离最小的k个训练样本，根据k个训练样本进行预测。

分类问题：k个点中出现频率最高的类别作为待测样本的类别

回归问题：通常以k个训练样本的平均值作为待测样本的预测值

kNN模型三要素：距离测度、k值的选择、分类或回归决策方式

'''

importnumpy as npclassKNNClassfier(object):def __init__(self, k=5, distance='euc'):

self.k=k

self.distance=distance

self.x=None

self.y=Nonedeffit(self,X, Y):'''

X : array-like [n_samples,shape]

Y : array-like [n_samples,1]

'''self.x=X

self.y=Ydefpredict(self,X_test):'''

X_test : array-like [n_samples,shape]

Y_test : array-like [n_samples,1]

output : array-like [n_samples,1]

'''output= np.zeros((X_test.shape[0],1))for i inrange(X_test.shape[0]):

dis=[]for j inrange(self.x.shape[0]):if self.distance == 'euc': #欧式距离

dis.append(np.linalg.norm(X_test[i]-self.x[j,:]))

labels=[]

index=sorted(range(len(dis)), key=dis.__getitem__)for j inrange(self.k):

labels.append(self.y[index[j]])

counts=[]for label inlabels:

counts.append(labels.count(label))

output[i]=labels[np.argmax(counts)]returnoutputdefscore(self,x,y):

pred=self.predict(x)

err= 0.0

for i inrange(x.shape[0]):if pred[i]!=y[i]:

err= err+1

return 1-float(err/x.shape[0])if __name__ == '__main__':from sklearn importdatasets

iris=datasets.load_iris()

x=iris.data

y=iris.target# x = np.array([[0.5,0.4],[0.1,0.2],[0.7,0.8],[0.2,0.1],[0.4,0.6],[0.9,0.9],[1,1]]).reshape(-1,2)

# y = np.array([0,1,0,1,0,1,1]).reshape(-1,1)

clf = KNNClassfier(k=3)

clf.fit(x,y)print('myknn score:',clf.score(x,y))from sklearn.neighbors importKNeighborsClassifier

clf_sklearn= KNeighborsClassifier(n_neighbors=3)

clf_sklearn.fit(x,y)print('sklearn score:',clf_sklearn.score(x,y))

weixin_39630735

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。