KNN算法 机器学习入门算法 流程总结

机器学习【KNN】(入门必备)

  • KNN的全称是K Nearest Neighbors。顾名思义,k个最接近的邻居。可以用于分类,也可以用于回归。

在这里插入图片描述如上图所示。中心点为测试数据,其他五边形和五角星为训练数据。k=3,测试数据属于五边形;k=5,测试数据属于五角星。

距离公式

  • 欧式距离

d ( x , y ) = ( x 1 − y 1 ) 2 + ( x 2 − y 2 ) 2 + ⋅ ⋅ ⋅ + ( x n − y n ) 2 = ∑ i = 1 n ( x i − y i ) 2 d(x, y) = \sqrt[]{(x_1 - y_1)^2 + (x_2 - y_2)^2 + ··· + (x_n - y_n)^2} = \sqrt[]{\sum_{i=1} ^ n {(x_i - y_i)} ^ 2} d(x,y)=(x1y1)2+(x2y2)2++(xnyn)2 =i=1n(xiyi)2

  • 曼哈顿距离
    d ( x , y ) = ∣ x 1 − y 1 ∣ + ∣ x 2 − y 2 ∣ + ⋅ ⋅ ⋅ + ∣ x n − y n ∣ = ∑ i = 1 n ∣ x i − y i ∣ d(x, y) = |x_1 - y_1| + |x_2 - y_2| + ··· + |x_n - y_n| = \sum_{i=1} ^ n {|x_i - y_i|} d(x,y)=x1y1+x2y2++xnyn=i=1nxiyi

KNN分类

  • 新来一个点,统计这个点周围距离最近k个点的类别标签,就可以推断出这个点属于哪个类别。

算法原理

* 新来一条测试数据,计算该数据与n训练数据之间的距离。
* 将得到的n个距离值排序。
* 取距离最小的k条数据。
* 计算k条数据所在类别的频数。
* 最后返回k条数据出现频数最高的类别,即为测试数据的类别。

KNN回归

  • 新来一个点,取这个点周围距离最近k个点的均值,然后去预测这个点的值。

算法原理

* 新来一条测试数据,计算该数据与n条训练数据之间的距离。
* 将得到的n个距离值排序。
* 取距离最小的k条数据的值,求均值。
* 返回均值做为测试数据的预测值。
欢迎大家交流学习,任何问题都可以留言
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值