KNN 算法的python实现迭代训练方式，将最近的测试样例作为训练样例扩大训练集

最新推荐文章于 2024-05-05 01:45:20 发布

seekerhit

最新推荐文章于 2024-05-05 01:45:20 发布

阅读量2.6k

点赞数 1

本文链接：https://blog.csdn.net/seekerhit/article/details/50903819

版权

本文介绍了如何用Python实现KNN算法，并通过迭代方式将测试样例加入训练集。默认使用k_value=3，数据文件为knn_train.txt和knn_test.txt。用户可以通过命令行参数调整训练集、测试集和k值。删除代码最后两行可禁用测试样例的自动添加功能。

摘要由CSDN通过智能技术生成

KNN算法的原理不在赘述，直接介绍源代码使用方式。

将代码保存为.py格式，默认使用的数据是代码文件所在目录下data目录下的 knn_train.txt 和knn_test.txt 两个文件分别作为训练样例和测试样例，默认k_value=3。以上参数可以在源代码中修改，也可以使用命令行参数传入，参考以下启动方式：

python knn.py train.txt test.txt 4

命令后三个参数分别是训练集，测试集，和k_value值。

程序默认将已经分类的测试样例作为训练样例使用，若要去掉该项，直接删除源代码中最后两行代码即可。

特别感谢：

点击打开链接

特别感谢 Android路上的人的测试数据。

python 源代码如下：

__author__ = 'Administrator'
############      KNN           ###############
#####        tm_year=2016, tm_mon=3, tm_mday=16, tm_hour=11, tm_min=51, tm_sec=3, tm_wday=2, tm_yday=76, tm_isdst=0          #####

import re
import sys


k_value = 3 ################   the parimater