上一篇幅中,我们介绍了k-近邻算法的基本概念、具体的分析步骤和分析方法,本篇中我们将介绍如何通过Python工具实现一个k-近邻算法。
1. 准备-使用Python导入数据
首先我们创建一个kNN.py的Python文件,在上面编写的Python文件中我们增加了如下代码:
from numpy import *
import operator
def createDataSet():
group =array([1.0,1.1],[1.0,1.0],[0,0],[0,0.1])
labels=['A','A','B','B']
return group,labels
上面的代码中,我们导入了两个模块;第一个是科学计算包Numpy;第二个是运算符模块,k-近邻算法执行排序是将使用这个模块提供的函数,后面我们将进一步介绍。
为了方便使用createDataSet()函数,用它创建数据集和标签。然后依次执行以下步骤:保存kNN.py文件,改变当前路径到存储kNN.py文件的位置,打开Python开发环境。
进入Python开发环境后,输入下列命令导入