KNN算法的原理不在赘述,直接介绍源代码使用方式。
将代码保存为.py格式,默认使用的数据是代码文件所在目录下data目录下的 knn_train.txt 和knn_test.txt 两个文件分别作为训练样例和测试样例,默认k_value=3。以上参数可以在源代码中修改,也可以使用命令行参数传入,参考以下启动方式:
python knn.py train.txt test.txt 4
命令后三个参数分别是训练集,测试集,和k_value值。
程序默认将已经分类的测试样例作为训练样例使用,若要去掉该项,直接删除源代码中最后两行代码即可。
特别感谢:
特别感谢 Android路上的人 的测试数据。
python 源代码如下:
__author__ = 'Administrator'
############ KNN ###############
##### tm_year=2016, tm_mon=3, tm_mday=16, tm_hour=11, tm_min=51, tm_sec=3, tm_wday=2, tm_yday=76, tm_isdst=0 #####
import re
import sys
k_value = 3 ################ the parimater