前面已经介绍了iris数据集的加载和预处理,接下来继续学习使用scikit-learn建模。
分类问题:根据数据集目标特性或属性,将待预测值划分到已有类别中。
常用分类算法:k近邻;逻辑回归;决策树;朴素贝叶斯等
建模四步骤分类:
-
调用需要使用的模型类
-
模型初始化
-
模型训练
-
模型预测
方法:
#模型调用:from sklearn.neighbors import KNeighborsClassifier
#创建实例:knn_i=KNeighborsClassifier(n_neighbors=i) //这里的knn_i意思是i表示k近邻的范围值
#模型训练: test=[[1,2,3,4],[3,4,2,5],[2,5,6,1]] //根据具体情况不同输入待测值,举例进行三组预测
knn_i.fit(X,Y) //上一节中利用iris数据集进行赋值。其中令X = iris.data;Y=iris.target
#模型预测: knn_i.predict(test) //利用i近邻进行预测
测试如下: