![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
KNN算法
Sakura_❀_
普普通通的大数据专业学生
展开
-
机器学习(三)KNN回归
基于KNN 算法,实现对于鸢尾花第四个数据的预测原理该算法用于回归预测,根据前三个特征属性,寻找最近的k个邻居,然后再根据k个邻居的第4个特征属性,去预测当前样本的第4个特征值数据集的准备和处理删除数据中不需要的类别列和重复的数据data = pd.read_csv(r"iris.arff.csv", header=0)#删除不需要class列(特征), 因为进行回归预测 ,类别信息,没有用处了data.drop(["class"],axis = 1, inplace = True)#删原创 2020-07-31 09:15:35 · 1699 阅读 · 0 评论 -
机器学习(二)KNN分类
基于KNN 算法,实现对于鸢尾花分类数据集的准备和处理数据集介绍Iris数据集每个样本x包含了花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)、花瓣宽度(petal width)四个特征。样本标签y共有三类,分别是Setosa,Versicolor和Virginica。Iris数据集总共包含150个样本,每个类别由50个样本,整体构成一个150行5列的二维表。数据集的处理1.导入 numpy库 和 pandas库提取数据im原创 2020-07-30 21:34:41 · 856 阅读 · 0 评论 -
机器学习(一)KNN算法介绍
KNN算法介绍算法概述KNN的全称是K-Nearest-Neighbors(最邻近规则分类),是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法。如图假设图中绿色的点就要预测的那个点,假设K=3。那么KNN算法就会找到与它距离最近的三个点(这里用圆圈圈起),通过比较哪种类别多一些,来将预测的点归为周围最多的类别。(比如这个例子中是蓝色三角形多一些,新来的绿色点就归类到蓝三角原创 2020-07-30 20:34:29 · 1440 阅读 · 0 评论