通过一整个机器学习的流程,来完成knn这个算法
*iris鸢尾花是sklearn.datasets自带的
*train_test_split是切割数据集,将数据划分为测试集和训练集
*特征工程是将数据标准化处理-->转换为[0,1]之间的数据方便计算器处理
其他的其实都是套路,步骤都一样的写代码即可,主要是整个思路要知道
'''
获取数据集
数据基本处理
特征工程
机器学习(模型训练)
模型评估
'''
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
# 1.获取数据集
iris = load_iris()
print(iris)
# 2.数据基本处理 异常值... 数据分割
# 2.1 数据分割
x_train, x_test, y_train, y_test = train_test_split(iris.data,iris.target,random_state=22,test_size=0.2)
# 3特征工程
# 3.1 实例化一个转换器
transfer = StandardScaler()
# 3.2 调用一个fit_transform方法
x_train = transfer.fit_transform(x_train)
x_test = transfer