参考 :https://www.bilibili.com/video/BV1Nt411i7oD?from=search&seid=4603953531395093043
KNN算法:给定一个训练数据集,对新的的输入实例,在训练数据集中找到与该实例最邻近的的K个实例,这K个实例的多数属于某个类,就把该实例分为这个类。
下面是代码实例
import csv
import random
with open('Prostate_Cancer.csv', 'r') as file: # 读取CSV文件
reader = csv.DictReader(file)
data = [row for row in reader] # 数组每一块单独的元素代表一个样本的全部特征
random.shuffle(data) # 打乱数据集
n = len(data)//3
test_set = data[0:n]
train_set = data