knn算法 k近邻算法demo(3) train_test_split拆分

最新推荐文章于 2024-09-22 10:41:50 发布

doublejie1001

最新推荐文章于 2024-09-22 10:41:50 发布

阅读量266

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/sinat_41636155/article/details/109171754

版权

本文演示了如何在K近邻（KNN）算法中应用train_test_split方法，将数据集划分为训练集和测试集，其中测试数据占总数据的20%，随机状态设为666。接着，文章计算并展示了模型的预测正确率，以此评估模型的性能。

摘要由CSDN通过智能技术生成

将数据成训练数据和测试数据，并计算正确率（评价）
X_train,X_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=666)

from sklearn.metrics import accuracy_score
from sklearn import datasets#引入数据集,sklearn包含众多数据集
from sklearn.model_selection import train_test_split#将数据分为测试集和训练集
from sklearn.neighbors import KNeighborsClassifier#利用邻近点方式训练数据
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np


###引入数据###
iris=datasets.load_iris()#引入iris鸢尾花数据,iris数据包含4个特征变量
# print(iris.keys())
# print(iris.DESCR)
iris_X=iris.data#特征变量
iris_y=iris.target#目标值
shuffle_indexes=np.random.permutation(len(iris_X))
print(shuffle_indexes)
test_ratio=0.2
test_size=int(len(iris_X)*test_ratio)
# print(test_size)
# test_indexex=shuffle_indexes[:test_size]
# train_indexex=shuffle_indexes[test_size:]
# print(test_indexex)
# print(train_indexex)
# X_train=iris_X[train_indexex]
# y_train=iris_y[train_indexex]
#