本次练习应用KNN算法对breast_cancer进行二分类。由于特征间量纲差异大,对特征先做归一化处理。数据预处理后,再利用学习曲线和交叉验证的方法寻找最佳n-neighbors。通过练习,基本掌握了KNN算法的Python实现及模型调优。
一、导入库
二、实例化并认识数据
可见:特征数据量纲差异大
三、数据预处理:归一化
本次练习应用KNN算法对breast_cancer进行二分类。由于特征间量纲差异大,对特征先做归一化处理。数据预处理后,再利用学习曲线和交叉验证的方法寻找最佳n-neighbors。通过练习,基本掌握了KNN算法的Python实现及模型调优。
一、导入库
二、实例化并认识数据
可见:特征数据量纲差异大
三、数据预处理:归一化