Python、sklearn、KNN分类算法学习——以鸢尾花数据分类为例
KNN分类算法学习——以鸢尾花分类为例KNN算法也叫k-近邻算法,是一种常用的分类算法。其分类原理为:如果一个样本在特征空间中的k个最相似的样本数据某一个类别,那该样本也属于这个类别。KNN算法核心思想:用你的“邻居”来推断你的类别关键点:该算法的核心是k值的选择。如果k值太少,容易受到异常值的影响;如果k值太大,容易受到样本不均衡影响。本案例使用Python作为编程语言,鸢尾花的数据从sklearn中导出,主要有以下步骤:获取数据数据处理 :数据集划分特征工程 :标准化(特征少,不需要降维
原创
2020-05-14 22:02:23 ·
1814 阅读 ·
0 评论