机器学习(1)KNN算法

最新推荐文章于 2024-10-09 23:54:44 发布

zy215215

最新推荐文章于 2024-10-09 23:54:44 发布

阅读量214

点赞数

文章标签：机器学习算法 python

本文链接：https://blog.csdn.net/zy215215/article/details/127470153

版权

from sklearn import neighbors,datasets
from sklearn.model_selection import train_test_split
data=datasets.load_breast_cancer()#载入数据集
X=data.data#自变量
y=data.target#因变量
print(data)
print(X)
print(y)
x_train,x_test,y_train,y_test=train_test_split(X,y,test_size=0.1,random_state=0)#将数据集随机分成训练集和测试集2部分，测试集占10%，random_state=0，保证每次运行得到同样的切分结果
clf=neighbors.KNeighborsClassifier(5)#设置临近数为5
clf.fit(x_train,y_train)#fit方法训练模型，结果存储在clf模型中
print(clf.score(x_test,y_test))
print(clf.predict([x_test[0]]),y_test[0],clf.predict_proba([x_test[0]]))
'''
调用预测方法predict，它的参数是一组自变量，输出结果是对应自变量的预测结果。对于分类模型，一般还支持predict_proba方法，输出结果是因变量属于每个分类的概率
'''