KNN算法分类
步骤:
1.导入数据
2.打乱数据集
3.划分训练集和测试集
4.构建模型
5.测试精度
说明:
前一部分为自己搭建的模型,后一部分调用内置接口
强调:
这里需要对数据集归一化处理,不然精确度只有百分之八十左右,归一化处理后可以达到百分之九十五以上。
这里采用的是均值方差归一化。
链接: https://pan.baidu.com/s/1oSVcBYqsCspmSNZMCIIv4Q
提取码: 4y2g
import numpy as np
import matplotlib.pyplot as plt
from numpy import loadtxt
# 导入数据
with open(r'C:\Users\Lenovo\Desktop\winedata.csv', 'r', encoding='UTF-8') as raw_data:
wine_data = loadtxt(raw_data, delimiter=',')
raw_data.close()
print(wine_data.shape)
# 将酒的特征放入data矩阵中
data = np.array(wine_data[:,1:])
# 将酒的类别放入target矩阵中
target = np.array(wine_data[:,0])
# 输出data,target矩阵的形状
print(data.shape)
print(target.shape)
# 定义数据打乱函数