python实现特征向量的knn分类

最新推荐文章于 2023-12-31 01:38:29 发布

RossieSeven

最新推荐文章于 2023-12-31 01:38:29 发布

阅读量2.7k

点赞数

文章标签：机器学习算法 spark python

本文链接：https://blog.csdn.net/RossieSeven/article/details/52629520

版权

该博客演示了如何用Python实现KNN算法对特征向量进行分类。通过创建数据集、归一化处理、计算距离并选择最近的k个邻居进行投票，从而确定样本类别。KNN算法的准确性受到k值的影响，需要调整k值找到最佳分类效果。代码中还包含了一个针对约会网站数据的测试案例。

摘要由CSDN通过智能技术生成

这是一个使用knn把特征向量进行分类的demo。

Knn算法的思想简单说就是：看输入的sample点周围的k个点都属于哪个类，哪个类的点最多，就把sample归为哪个类。也就是说，训练集是一些已经被手动打好标签的数据，knn会根据你打好的标签来挖掘同类对象的相似点，从而推算sample的标签。

Knn算法的准确度受k影响较大，可能需要写个循环试一下选出针对不同数据集的最优的k。

至于如何拿到特征向量，可以参考之前的博文。

代码：

#-*- coding: utf-8 -*-
__author__ = 'Rossie'
from numpy import *
import operator

'''构造数据'''
def createDataSet():
    characters=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels=['A','A','B','B']
    return characters,labels

''&#