from sklearn import neighbors,datasets
from sklearn.model_selection import train_test_split
data=datasets.load_breast_cancer()#载入数据集
X=data.data#自变量
y=data.target#因变量
print(data)
print(X)
print(y)
x_train,x_test,y_train,y_test=train_test_split(X,y,test_size=0.1,random_state=0)#将数据集随机分成训练集和测试集2部分,测试集占10%,random_state=0,保证每次运行得到同样的切分结果
clf=neighbors.KNeighborsClassifier(5)#设置临近数为5
clf.fit(x_train,y_train)#fit方法训练模型,结果存储在clf模型中
print(clf.score(x_test,y_test))
print(clf.predict([x_test[0]]),y_test[0],clf.predict_proba([x_test[0]]))
'''
调用预测方法predict,它的参数是一组自变量,输出结果是对应自变量的预测结果。对于分类模型,一般还支持predict_proba方法,输出结果是因变量属于每个分类的概率
'''
机器学习(1)KNN算法
最新推荐文章于 2024-10-09 23:54:44 发布