K-近邻算法API
1.步骤分析
-
1.获取数据集
-
2.数据基本处理
-
3.特征工程
-
4.机器学习(模型训练)
-
5.模型评估
-
导入模块
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
- 先从sklearn当中获取数据集,然后进行数据集的分割
# 1.获取数据集
iris = load_iris()
# 2.数据基本处理
# x_train,x_test,y_train,y_test为训练集特征值、测试集特征值、训练集目标值、测试集目标值
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
- 进行数据标准化
- 特征值的标准化
# 3、特征工程:标准化
transfer = StandardScaler()
x_train = transfer